pf_pageparser:PHP中的简单Regex HTML页面解析器

时间:2024-05-20 09:22:23
【文件属性】:

文件名称:pf_pageparser:PHP中的简单Regex HTML页面解析器

文件大小:8KB

文件格式:ZIP

更新时间:2024-05-20 09:22:23

html php parse scrape HTML

pf_pageparser 这是我编写HTML解析器,因为我刮了很多网站以查找结构化的重复数据。 这个解析器使我可以轻松清理HTML,将其拆分成块并在每个块中找到正确的数据。它不使用DOM解析器,因此它也可以用于部分或无效HTML 安装 您可以通过composer安装该软件包: composer require pforret/pf_pageparser 用法 $ pp = New PfPageparser ([ "cacheTtl" => 300 ]); $ pp -> load_from_url ( "http://www.example.com/products" ) -> trim ( "

" ) -> split_chunks ( '' ) -> filter_chunks ( 'product_id' )


【文件预览】:
pf_pageparser-master
----src()
--------PfPageparser.php(8KB)
----LICENSE.md(1KB)
----.styleci.yml(66B)
----CONTRIBUTING.md(3KB)
----composer.json(1KB)
----CHANGELOG.md(316B)
----.github()
--------workflows()
----README.md(2KB)
----TODO.md(0B)

网友评论