文件名称:html5lib-python:符合标准的库,用于在Python中解析和序列化HTML文档和片段
文件大小:294KB
文件格式:ZIP
更新时间:2024-03-17 04:09:11
Python
html5lib html5lib是用于解析HTML的纯Python库。 它被设计为符合WHATWG HTML规范,所有主要的Web浏览器都实现了该规范。 用法 简单用法遵循以下模式: import html5lib with open ( "mydocument.html" , "rb" ) as f : document = html5lib . parse ( f ) 或者: import html5lib document = html5lib . parse ( "
Hello World!" ) 默认情况下, document将是xml.etree元素实例。 html5lib尽可能选择加速的ElementTree实现(即Python 2.x上的xml.etree.cElementTree )。 支持其他两种树类型: xml.dom.minidom和lx