一、什么是序列化
在我们存储数据或者网络传输数据的时候,需要对我们的对象进行处理,把对象处理成方便存储和传输的数据格式。这个过程叫序列化,不同的序列化结果也不同,但目的是一样的,都是为了存储和传输
在Python中三种序列化的方案:
-
pickle
,可以将我们Python中任意数据类型转化为bytes并写入到文件中。同样也可以把文件中写好的bytes转换回到我们Python的数据-这个过程被称为反序列化。 -
shelve
简单另类的一种序列化方案。有点类似于Redis,可以作为一种小型的数据库来使用。 -
json
,将Python中常见的字典,列表转化成字符串,是目前前后端数据交互使用频率最高的一种数据模式。
二、json
1.什么是json
json是前后端交互的枢纽,相当于编程界的普通话,前后端用Python沟通。因为json的语法格式可以完美的表示出一个对象。那么什么是json:json全称JavaScript object notation
,即js对象简谱,例如下面代码示例:
{
"id": 1,
"title": "Python从入门到放弃(第二版)",
"pub_date": "2018-01-11",
"category": "Python",
"publisher": {
"id": 1,
"name": "北京出版社"
},
"post_authors": [
{
"id": 2,
"name": "佚名"
}
]
}
这段形如Python字典的东西在JavaScript里面叫json,其实是一样的。我们发现用这样的数据结构可以完美的表示出任何对象,并且可以完整的把对象表示出来。只要代码格式比较好,那么可读性也挺强的,所以大家公认用这样一种数据结构作为数据交互的格式。
在json之前,通常用的数据结构为XML,形如:
<?xml version="1.0" encoding="utf-8" ?>
<book>
<title>Python从入门到放弃(第二版)</title>
<pub_date>2018-01-11</pub_date>
<category>Python</category>
<publisher>
<id>1</id>
<name>北京出版社</name>
</publisher>
</book>
总之,XML格式的文件在维护和处理上相比json文件很难解析,所以后来大都倾向于使用json这一数据结构了。
2.json在Python中的用法
字典 -> json
要先引入json模块
,再进行处理
import json
dic = {"姓名": "程序猿", "年龄": 28, "头发": None}
s = json.dumps(dic)
print(s)
# 输出:
>>>{"\u59d3\u540d": "\u7a0b\u5e8f\u733f", "\u5e74\u9f84": 28, "\u5934\u53d1": null}
结果很不友好啊. 那如何处理成中⽂呢? 在dumps
的时候给出另一个参数ensure_ascii=False
就可以了了。
import json
dic = {"姓名": "程序猿", "年龄": 28, "头发": None}
s = json.dumps(dic, ensure_ascii=False)
print(s)
# 输出:
>>>{"姓名": "程序猿", "年龄": 28, "头发": null}
json -> 字典
上面介绍的是如何把字典格式的数据转化为json,那么怎么把前端传递过来的json文件转化为字典格式呢:
import json
s = '{"姓名": "程序猿", "年龄": 28, "头发": null}'
# 注意此处要加引号,表示s为字符串-the JSON object must be str
dic = json.loads(s)
print(dic)
print(type(dic))
# 输出:
>>> {'姓名': '程序猿', '年龄': 28, '头发': None}
>>> <class 'dict'>
写入/读取json文件
json也可以像pickle
一样把序列化的结果写入到文件中:
import json
dic = {"姓名": "程序猿", "年龄": 28, "头发": None}
f = open('test.json', mode='w', encoding="utf-8")
# 把对象打散成json写入到文件中
json.dump(dic, f, ensure_ascii=False)
f.close()
test.json
中显示:
{
"姓名": "程序猿",
"年龄": 28,
"头发": null
}
同样也可以从文件中读取一个json:
import json
f = open('test.json', mode='r', encoding="utf-8")
dic = json.load(f)
f.close()
print(dic)
# 输出:
>>> {'姓名': '程序猿', '年龄': 28, '头发': None}
注意: 我们可以向同一个文件中写入多个json串,但是读不行
import json
lst = [
{"a": 1},
{'b': 2},
{'c': 3}
]
f = open("test.json", mode="w", encoding="utf-8")
for dic in lst:
json.dump(dic, f)
f.close()
test.json
中显示:

可以看到此时文件中的内容是一行的,所以会有红色下划线显示报错信息,这在读取的时候是无法正常读取的。如何解决读取问题呢?两种方案。
方案一:
把所有的内容准备好统一进行写入和读取,但是这样处理,如果数据量小还好,数据量大的话就很麻烦了。
方案二:
不用dump
方法,改用dumps
和loads
,对每一行分别进行处理。
import json
lst = [
{"a": 1},
{'b': 2},
{'c': 3}
]
# 写入
f = open("test.json", mode="w", encoding="utf-8")
for dic in lst:
s = json.dumps(dic, ensure_ascii=True) + '\n'
f.write(s)
f.close()
# 读取
f = open("test.json", mode='r', encoding='utf-8')
for line in f:
d = json.loads(line.strip())
print(d)
f.close()
打印结果为:
{'a': 1}
{'b': 2}
{'c': 3}
这样的话就能正常读取了!