文件名称:pf_pageparser:PHP中的简单Regex HTML页面解析器
文件大小:8KB
文件格式:ZIP
更新时间:2024-05-20 09:22:23
html php parse scrape HTML
pf_pageparser 这是我编写HTML解析器,因为我刮了很多网站以查找结构化的重复数据。 这个解析器使我可以轻松清理HTML,将其拆分成块并在每个块中找到正确的数据。它不使用DOM解析器,因此它也可以用于部分或无效HTML 安装 您可以通过composer安装该软件包: composer require pforret/pf_pageparser 用法 $ pp = New PfPageparser ([ "cacheTtl" => 300 ]); $ pp -> load_from_url ( "http://www.example.com/products" ) -> trim ( "