Python解析JSON对象的全过程记录

时间:2022-05-22 23:16:41

前言

本章节我们将为大家介绍如何使用 Python 语言来编码和解码 JSON 对象。

json处理模块的主要任务,是将一个JSON对象,转换成Python数据类型数据进行处理,或者反之,将Python数据类型数据,转换成JSON对象(字符串流),在不同的模块或者系统间传输。

1. JSON数据格式特点

  1. 对象表示为键值对
  2. 数据由逗号分隔
  3. 花括号保存对象
  4. 方括号保存数组
  1. {
  2. "students": [
  3. { "name":"北山啦" , "age":20 },
  4. { "name":"张三" , "age":30 },
  5. { "name":"里斯" , "age":17 }
  6. ]
  7. }
  1. {'students': [{'name': '北山啦', 'age': 20},
  2. {'name': '张三', 'age': 30},
  3. {'name': '里斯', 'age': 17}]}

上面就是一个JSON格式数据。它开起来就像是在Python中的字典数据类型。我们可以通过json模块将它转换成字符串或者反过来将字符串转换成字典数据类型。

JSON也支持各种数据类型,它的数据类型和Python各种数据类型之间的对比如下:

  • object —— dict
  • array —— list
  • string —— str
  • number —— int/float
  • true/false —— True/False
  • null —— None

2. 常用方法总结

在json模块中,用于处理json的主要是四个函数,分别是:

  • loads():从JSON字符串中读取数据并转换成Python数据类型
  • load():从JSON文件中读取数据并转换成Python数据类型
  • dumps():将Python数据类型数据转换成JSON字符串
  • dump():将Python数据类型数据转换成JSON字符串写入到文件

3. 系列化和反系列化

Python解析JSON对象的全过程记录

从JSON数据转换到Python数据,叫反系列化(deserialization)

从Python数据转换到JSON数据,叫系列化(serialization)

3.1 系列化

系列化:将Python数据转换成JSON字符串的方法。

下面我们先来看一个简单的例子。

  1. import json
  2.  
  3. data = {
  4. "students": [
  5. { "name":"北山啦" , "age":20 },
  6. { "name":"张三" , "age":30 },
  7. { "name":"里斯" , "age":17 }
  8. ]
  9. }
  10. print(type(data))
  11. print(data)
  12. json_str = json.dumps(data)
  13. print(type(json_str))
  1. <class 'dict'>
  2. {'students': [{'name': '北山啦', 'age': 20}, {'name': '张三', 'age': 30}, {'name': '里斯', 'age': 17}]}
  3. <class 'str'>

上面的例子中,虽然看起来数据没有发生变化,但其实它们的数据类型已经发生了本质的改变:将字典数据类型的data,转换成了str类型,然后我们就可以将这个str类型的数据转换成流,在网络上进行传输或者写入到文件等。

  1. import json
  2.  
  3. data = {
  4. "students": [
  5. { "name":"北山啦" , "age":20 },
  6. { "name":"张三" , "age":30 },
  7. { "name":"里斯" , "age":17 }
  8. ]
  9. }
  10.  
  11. print(type(data))
  12. print(data)
  13. json_str = json.dumps(data, separators=('>>','::'), indent=2)
  14. print(json_str)
  1. <class 'dict'>
  2. {'students': [{'name': '北山啦', 'age': 20}, {'name': '张三', 'age': 30}, {'name': '里斯', 'age': 17}]}
  3. {
  4. "students"::[
  5. {
  6. "name"::"\u5317\u5c71\u5566">>
  7. "age"::20
  8. }>>
  9. {
  10. "name"::"\u5f20\u4e09">>
  11. "age"::30
  12. }>>
  13. {
  14. "name"::"\u91cc\u65af">>
  15. "age"::17
  16. }
  17. ]
  18. }

将data写入txt文件中

  1. import json
  2.  
  3. data = {
  4. "students": [
  5. { "name":"北山啦" , "age":20 },
  6. { "name":"张三" , "age":30 },
  7. { "name":"里斯" , "age":17 }
  8. ]
  9. }
  10. with open("students.txt","w") as fp:
  11. json.dump(data, fp, ensure_ascii=False)
  12. print("finish")

finish

这样就将data写入了students.txt,看看是不是已经将数据写进去了。

3.2 反系列化

从JSON数据转换到Python类型数据,叫反系列化。可以通过loads()/load()这两个方法来完成。

  1. import json
  2. with open("students.txt") as fp:
  3. data = json.load(fp)
  4. """取出字典key为students的数据,
  5. 得到一个list,再从这个list中取第一个数据"""
  6. print(data['students'][0])

{'name': '北山啦', 'age': 20}

parse_int参数

默认值为None,如果指定了parse_int,用来对JSON int字符串进行解码,这可以用于为JSON整数使用另一种数据类型或解析器。

parse_int参数,这里我们简单将其指定为float类型。

  1. import json
  2. with open("students.txt") as fp:
  3. data = json.load(fp, parse_int = float)
  4. print(data)

{'students': [{'name': '北山啦', 'age': 20.0}, {'name': '张三', 'age': 30.0}, {'name': '里斯', 'age': 17.0}]}

可以看到,age原来是整数类型,通过parse_int已经被转换成了float类型。

object_hook

默认值为None,object_hook是一个可选函数,此功能可用于实现自定义解码器。指定一个函数,该函数负责把反序列化后的基本类型对象转换成自定义类型的对象。

  1. def fromJSON(dct): # 这里会对所有的字典数据类型都进行遍历
  2. if isinstance(dct, dict) and 'students' in dct:
  3. return dct['students']
  4. else:
  5. return Student(dct['name'], dct['age'])
  6.  
  7. import json
  8.  
  9. with open("students.txt") as fp:
  10. data = json.load(fp, object_hook=fromJSON)
  11. print(data)

[姓名: 北山啦, 年龄: 20, 姓名: 张三, 年龄: 30, 姓名: 里斯, 年龄: 17]

总结

到此这篇关于Python解析JSON对象的文章就介绍到这了,更多相关Python解析JSON对象内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/qq_45176548/article/details/115119022