常见的机器可读格式包括:
- 逗号分隔值(Comma-Separated Values,CSV)
- 制表符分隔值(tab-separated values,TSV)
- JavaScript 对象符号(JavaScript Object Notation,JSON)
- 可扩展标记语言(eXtensible Markup Language,XML)
Python 导入CSV数据
import csv csvfile = open('data.csv', 'rb')
reader = csv.reader(csvfile) for row in reader:
print row
Python 导入JSON数据
import json json_data = open('data.json').read() data = json.loads(json_data) for item in data:
print item
Python 对 XML 的解析
常见的 XML 编程接口有 DOM 和 SAX,这两种接口处理 XML 文件的方式不同,当然使用场合也不同。
Python 有三种方法解析 XML,SAX,DOM,以及 ElementTree:
1.SAX (simple API for XML )
Python 标准库包含 SAX 解析器,SAX 用事件驱动模型,通过在解析XML的过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件。
2.DOM(Document Object Model)
将 XML 数据在内存中解析成一个树,通过对树的操作来操作XML。
3.ElementTree(元素树)
ElementTree就像一个轻量级的DOM,具有方便友好的API。代码可用性好,速度快,消耗内存少。