microdata:用于提取html微数据的python库

时间:2024-03-28 03:36:49
【文件属性】:

文件名称:microdata:用于提取html微数据的python库

文件大小:9KB

文件格式:ZIP

更新时间:2024-03-28 03:36:49

Python

微数据 microdata.py是一个小型实用程序库,用于从HTML提取。 依靠来完成构建DOM的繁重工作。 有关HTML5微数据的更多信息,请参阅有关Mark Pilgrim的。 命令行 当您通过pip安装microdata.py时,它也会在命令行上可用: % microdata.py http://www.wdl.org/en/item/1/ 这将打印出从提供的URL中提取的项目的JSON。 图书馆 这是Python的基本用法,以为例: >> > import microdata >> > import urllib >> > url = "https://raw.github.com/edsu/microdata/master/test-data/example.html" >> > items = microdata . get_items ( urllib . urlope


【文件预览】:
microdata-master
----setup.py(489B)
----.gitignore(24B)
----LICENSE.md(277B)
----.travis.yml(180B)
----test-data()
--------example.html(1KB)
--------example-nested.html(1KB)
--------multiple-props.html(1KB)
--------unlinked.html(1KB)
--------skip-level.html(352B)
----README.md(2KB)
----test.py(6KB)
----microdata.py(6KB)

网友评论