用python pickle库来存储数据对象

时间:2022-09-23 13:26:38

pickling有一个更常用的叫法是serialization,它是指把python对象转化成字节流byte stream, unpickling就是把byte stream转换成对象。python的pickle函数包中的pickle.dump,可以帮助把对象以字节流的形式储存在pickle文件,等到用时pickle.load可以帮助载入。

在数据科学中可以巧用它来存在数据对象,数据类型可以是如string, int, numpy.array, dict, tuple, etc. 真是爽爆了。简单的例子如下:

# 存储字符串.
import pickle
longstring="Iamaverylongstring"
#用pickle.dump存储数据
pickle.dump(longstring,open("longstringfile.pkl","w")) #用pickle.load提取
string1=pickle.load(open("longstringfile.pkl"))
Print string1 # 存储numpy.array
import numpy
list1=[[1,2,3],[2,4,6]]
anp1=numpy.array(list1)
print np1 pickle.dump(anp,open("npfile.pkl","w"))
np2=pickle.load(open("npfile.pkl"))
print np2
print type(np2)

结果如下:

Iamaverylongstring
[[1 2 3]
[2 4 6]]
[[1 2 3]
[2 4 6]]
<type 'numpy.ndarray'>