Python数据存储:pickle模块的使用讲解

时间:2024-07-28 17:03:44

在机器学习中,我们常常需要把训练好的模型存储起来,这样在进行决策时直接将模型读出,而不需要重新训练模型,这样就大大节约了时间。Python提供的pickle模块就很好地解决了这个问题,它可以序列化对象并保存到磁盘中,并在需要的时候读取出来,任何对象都可以执行序列化操作。

Pickle模块中最常用的函数为:

(1)pickle.dump(obj, file, [,protocol])

函数的功能:将obj对象序列化存入已经打开的file中。

参数讲解:

  • obj:想要序列化的obj对象。
  • file:文件名称。
  • protocol:序列化使用的协议。如果该项省略,则默认为0。如果为负值或HIGHEST_PROTOCOL,则使用最高的协议版本。

(2)pickle.load(file)

函数的功能:将file中的对象序列化读出。

参数讲解:

  • file:文件名称。

(3)pickle.dumps(obj[, protocol])

函数的功能:将obj对象序列化为string形式,而不是存入文件中。

参数讲解:

  • obj:想要序列化的obj对象。
  • protocal:如果该项省略,则默认为0。如果为负值或HIGHEST_PROTOCOL,则使用最高的协议版本。

(4)pickle.loads(string)

函数的功能:从string中读出序列化前的obj对象。

参数讲解:

  • string:文件名称。

【注】 dump() 与 load() 相比 dumps() 和 loads() 还有另一种能力dump()函数能一个接着一个地将几个对象序列化存储到同一个文件中,随后调用load()来以同样的顺序反序列化读出这些对象。

【代码示例】

pickleExample.py

  1. #coding:utf-8
  2. __author__ = 'MsLili'
  3. #pickle模块主要函数的应用举例
  4. import pickle
  5. dataList = [[1, 1, 'yes'],
  6. [1, 1, 'yes'],
  7. [1, 0, 'no'],
  8. [0, 1, 'no'],
  9. [0, 1, 'no']]
  10. dataDic = { 0: [1, 2, 3, 4],
  11. 1: ('a', 'b'),
  12. 2: {'c':'yes','d':'no'}}
  13. #使用dump()将数据序列化到文件中
  14. fw = open('dataFile.txt','wb')
  15. # Pickle the list using the highest protocol available.
  16. pickle.dump(dataList, fw, -1)
  17. # Pickle dictionary using protocol 0.
  18. pickle.dump(dataDic, fw)
  19. fw.close()
  20. #使用load()将数据从文件中序列化读出
  21. fr = open('dataFile.txt','rb')
  22. data1 = pickle.load(fr)
  23. print(data1)
  24. data2 = pickle.load(fr)
  25. print(data2)
  26. fr.close()
  27. #使用dumps()和loads()举例
  28. p = pickle.dumps(dataList)
  29. print( pickle.loads(p) )
  30. p = pickle.dumps(dataDic)
  31. print( pickle.loads(p) )

结果为:

Python数据存储:pickle模块的使用讲解

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.****.net/coffee_cream/article/details/51754484