python学习之----lxml库和HTML parser

时间:2023-03-08 22:52:44
python学习之----lxml库和HTML parser

lxml

这个库(http://lxml.de/)可以用来解析HTML 和XML 文档,以非常底层的实现而闻名

于世,大部分源代码是用C 语言写的。虽然学习它需要花一些时间(其实学习曲线越

陡峭,表明你可以越快地学会它),但它在处理绝大多数HTML 文档时速度都非常快。

• HTML parser

这是Python 自带的解析库(https://docs.python.org/3/library/html.parser.html)。因为它不

用安装(只要装了Python 就有),所以可以很方便地使用。