html5lib-python:符合标准的库,用于在Python中解析和序列化HTML文档和片段

时间:2024-03-17 04:09:11
【文件属性】:

文件名称:html5lib-python:符合标准的库,用于在Python中解析和序列化HTML文档和片段

文件大小:294KB

文件格式:ZIP

更新时间:2024-03-17 04:09:11

Python

html5lib html5lib是用于解析HTML的纯Python库。 它被设计为符合WHATWG HTML规范,所有主要的Web浏览器都实现了该规范。 用法 简单用法遵循以下模式: import html5lib with open ( "mydocument.html" , "rb" ) as f : document = html5lib . parse ( f ) 或者: import html5lib document = html5lib . parse ( "

Hello World!" ) 默认情况下, document将是xml.etree元素实例。 html5lib尽可能选择加速的ElementTree实现(即Python 2.x上的xml.etree.cElementTree )。 支持其他两种树类型: xml.dom.minidom和lx


网友评论