Python 爬虫-信息的标记xml,json,yaml

时间:2024-12-13 20:34:49

2017-07-26  23:53:03

信息标记的作用有:

  • 标记后的信息可形成信息组织结构,增加了信息维度
  • 标记的结构与信息一样具有重要价值
  • 标记后的信息可用于通信、存储或展示
  • 标记后的信息更利于程序理解和运用

信息标记的三种形式:

  • XML
  • JSON
  • YAML

一、XML

xml 的表达格式:

Python 爬虫-信息的标记xml,json,yaml

Python 爬虫-信息的标记xml,json,yaml

 实例:

Python 爬虫-信息的标记xml,json,yaml

二、json

json:JavsScript Object Notation,也就是说json是js中对面向对象信息的一种表达形式。简单讲json是指对有类型的键值对的表达形式。

Python 爬虫-信息的标记xml,json,yaml

Python 爬虫-信息的标记xml,json,yaml

Python 爬虫-信息的标记xml,json,yaml

实例:

Python 爬虫-信息的标记xml,json,yaml

三、YAML

json采用有类型的表达方式,而YAML则是一种无类型的方式来表达信息。

总的格式如下:

Python 爬虫-信息的标记xml,json,yaml

举例说明:

Python 爬虫-信息的标记xml,json,yaml

Python 爬虫-信息的标记xml,json,yaml

实例:

Python 爬虫-信息的标记xml,json,yaml

四、三种表达格式的比较

XML: 最早的通用信息标记语言,可扩展性好,但繁琐;Internet上的信息交互与传递
JSON: 信息有类型,适合程序处理(js),较XML简洁;移动应用云端和节点的信息通信,无注释
YAML: 信息无类型,文本信息比例最高,可读性好;各类系统的配置文件,有注释易读