Python学习之json序列化

一、什么是序列化

在我们存储数据或者网络传输数据的时候，需要对我们的对象进行处理，把对象处理成方便存储和传输的数据格式。这个过程叫序列化，不同的序列化结果也不同，但目的是一样的，都是为了存储和传输
在Python中三种序列化的方案：

pickle，可以将我们Python中任意数据类型转化为bytes并写入到文件中。同样也可以把文件中写好的bytes转换回到我们Python的数据-这个过程被称为反序列化。
shelve简单另类的一种序列化方案。有点类似于Redis，可以作为一种小型的数据库来使用。
json，将Python中常见的字典，列表转化成字符串，是目前前后端数据交互使用频率最高的一种数据模式。

二、json

1.什么是json

json是前后端交互的枢纽，相当于编程界的普通话，前后端用Python沟通。因为json的语法格式可以完美的表示出一个对象。那么什么是json：json全称JavaScript object notation，即js对象简谱，例如下面代码示例：

{

  "id": 1,

  "title": "Python从入门到放弃(第二版)",

  "pub_date": "2018-01-11",

  "category": "Python",

  "publisher": {

    "id": 1,

    "name": "北京出版社"

  },

  "post_authors": [

    {

      "id": 2,

      "name": "佚名"

    }

  ]

}

这段形如Python字典的东西在JavaScript里面叫json，其实是一样的。我们发现用这样的数据结构可以完美的表示出任何对象，并且可以完整的把对象表示出来。只要代码格式比较好，那么可读性也挺强的，所以大家公认用这样一种数据结构作为数据交互的格式。
在json之前，通常用的数据结构为XML，形如:

<?xml version="1.0" encoding="utf-8" ?>

<book>

<title>Python从入门到放弃(第二版)</title>

<pub_date>2018-01-11</pub_date>

<category>Python</category>

<publisher>

    <id>1</id>

    <name>北京出版社</name>

</publisher>

</book>

总之，XML格式的文件在维护和处理上相比json文件很难解析，所以后来大都倾向于使用json这一数据结构了。

2.json在Python中的用法

字典 -> json

要先引入json模块，再进行处理

import json

dic = {"姓名": "程序猿", "年龄": 28, "头发": None}

s = json.dumps(dic)

print(s)

# 输出：

>>>{"\u59d3\u540d": "\u7a0b\u5e8f\u733f", "\u5e74\u9f84": 28, "\u5934\u53d1": null}

结果很不友好啊. 那如何处理成中⽂呢? 在dumps的时候给出另一个参数ensure_ascii=False就可以了了。

import json

dic = {"姓名": "程序猿", "年龄": 28, "头发": None}

s = json.dumps(dic, ensure_ascii=False)

print(s)

# 输出：

>>>{"姓名": "程序猿", "年龄": 28, "头发": null}

json -> 字典

上面介绍的是如何把字典格式的数据转化为json，那么怎么把前端传递过来的json文件转化为字典格式呢：

import json

s = '{"姓名": "程序猿", "年龄": 28, "头发": null}'

# 注意此处要加引号，表示s为字符串-the JSON object must be str

dic = json.loads(s)

print(dic)

print(type(dic))

# 输出：

>>> {'姓名': '程序猿', '年龄': 28, '头发': None}

>>> <class 'dict'>

写入/读取json文件

json也可以像pickle一样把序列化的结果写入到文件中：

import json

dic = {"姓名": "程序猿", "年龄": 28, "头发": None}

f = open('test.json', mode='w', encoding="utf-8")

# 把对象打散成json写入到文件中

json.dump(dic, f, ensure_ascii=False)

f.close()

test.json中显示：

{

  "姓名": "程序猿",

  "年龄": 28,

  "头发": null

}

同样也可以从文件中读取一个json：

import json

f = open('test.json', mode='r', encoding="utf-8")

dic = json.load(f)

f.close()

print(dic)

# 输出：

>>> {'姓名': '程序猿', '年龄': 28, '头发': None}

注意: 我们可以向同一个文件中写入多个json串，但是读不行

import json

lst = [

    {"a": 1},

    {'b': 2},

    {'c': 3}

]

f = open("test.json", mode="w", encoding="utf-8")

for dic in lst:

    json.dump(dic, f)

f.close()

test.json中显示：
Python学习之json序列化
可以看到此时文件中的内容是一行的，所以会有红色下划线显示报错信息，这在读取的时候是无法正常读取的。如何解决读取问题呢？两种方案。
方案一：
把所有的内容准备好统一进行写入和读取，但是这样处理，如果数据量小还好，数据量大的话就很麻烦了。
方案二：
不用dump方法，改用dumps和loads，对每一行分别进行处理。

import json

lst = [

    {"a": 1},

    {'b': 2},

    {'c': 3}

]

# 写入

f = open("test.json", mode="w", encoding="utf-8")

for dic in lst:

    s = json.dumps(dic, ensure_ascii=True) + '\n'

    f.write(s)

f.close()

# 读取

f = open("test.json", mode='r', encoding='utf-8')

for line in f:

    d = json.loads(line.strip())

    print(d)

f.close()

打印结果为：

{'a': 1}

{'b': 2}

{'c': 3}

这样的话就能正常读取了！

秒客网