sklearn基于pickle / joblib 的模型保存及加载

飞熊 • 2023年9月5日下午6:57 • Python • 阅读 410

不管现实多么惨不忍睹，都要持之以恒地相信，这只是黎明前短暂的黑暗而已。不要惶恐眼前的难关迈不过去，不要担心此刻的付出没有回报，别再花时间等待天降好运。真诚做人，努力做事！你想要的，岁月都会给你。sklearn基于pickle / joblib 的模型保存及加载，希望对大家有帮助，欢迎收藏，转发！站点地址：www.bmabk.com，来源：原文

sklearn（scikit-learn）模型持久化有两种方式：

Python的内置模块pickle
scikit-learn内部的joblib

1. pickle 模型保存及加载

模型定义及训练：

from sklearn import svm
from sklearn import datasets
model_xgb = svm.SVC()
X, y= datasets.load_iris(return_X_y=True)
model_xgb.fit(X, y)

基于 pickle 实现模型保存及加载：

import pickle 

#1.保存成Python支持的文件格式Pickle
#在当前目录下可以看到new_app_model_v1.pickle
with open('new_app_model_v1.pickle','wb') as fw:
	pickle.dump(model_xgb,fw)
#加载svm.pickle
with open('new_app_model_v1.pickle','rb') as fr:
	new_app_model_v1 = pickle.load(fr)

print (new_app_model_v1.predict_proba(X_test[0:1].values))

2. joblib 模型保存及加载

在大量数据的情况下，最好使用scikit-learn的的joblib代替python的pickle（dump＆load），这在内部装有大型numpy数组的对象上效率更高。
总结起来，joblib更适合大数据量的模型，不过joblib只能往硬盘存储，不能往字符串存储。

from sklearn.externals import joblib

# 保存模型
joblib.dump(model_xgb, 'new_app_model_v1.pkl')
print("Model dumped!")

# 把训练集中的列名保存为pkl
model_columns = list(X_train.columns)
joblib.dump(model_columns, 'new_app_model_v1_columns.pkl')
print("Models columns dumped!")

new_app_model_v1 = joblib.load('new_app_model_v1.pkl')  # Load "model.pkl"
print('Model loaded')
new_app_model_v1_columns = joblib.load('new_app_model_v1_columns.pkl')  
# Load "model_columns.pkl"

print('Model columns loaded')
print (new_app_model_v1.predict_proba(X_test[0:1].values))

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

文章由极客之音整理，本文链接：https://www.bmabk.com/index.php/post/162818.html

赞 (0)

0 0

Python

python字典访问的三种方法的详细用法

000384

小半
2024年2月23日
Python自学教程教程

Pydantic，一个超实用的python库

000199

python学霸
2024年4月21日
Python

六、Python 字典

000209

小半
2022年12月12日
Python

W3Schools-NumPy系列3

000202

小半
2024年3月14日
Python

解锁scrapy报错：Unknown command: crawl

000251

小半
2023年1月1日
Python

Django加Vue电商项目实战10 模型表单实现用户注册实战

000210

小半
2022年11月2日
Django自学教程

Django笔记五之字段类型

000250

小半
2023年12月7日
Python

MySQL调优思考和案例解读

000302

小半
2023年1月1日
Python

AnimationFreeCAD：PyFlow 为 FreeCAD 赋能，流程化构建创意3D动画

000743

小白这样学Python
2024年4月1日
Python自学教程教程

Python入门系列（九）pip、try except、用户输入、字符串格式

000230

小半
2024年3月14日
Python

xml文件报错：The content of elements must consist of well-formed character data or markup.

000414

seven_
2023年2月21日
Python

Python路线图

000583

小半
2024年3月14日

发表回复

登录后才能评论

极客之音——专业性很强的中文编程技术网站，欢迎收藏到浏览器，订阅我们！