文件名称:readability.php:Mozilla的Readability.jsPHP端口
文件大小:3.06MB
文件格式:ZIP
更新时间:2024-05-28 10:34:43
php readability domdocument libxml PHP
Readability.php Mozilla的PHP端口。 解析html文本(通常是新闻和其他文章),并返回标题,作者,主要图像和文本内容,而没有导航栏,广告,页脚或任何非文本主体的内容。 分析每个节点,给它们一个分数,并确定相关的内容和可以丢弃的内容。 该项目的目标是成为Mozilla版本的1对1端口,并密切关注那里引入的所有更改,但是结构上存在一些主要差异。 大部分代码是1:1副本(甚至导入了注释),但是对某些功能和结构进行了调整,以更好地适应PHP语言。 首席开发人员:Andres Rey 要求 PHP 7.0以上版本,ext-dom,ext-xml和ext-mbstring。 要安装所有这些依赖项(在极少数情况下,您的系统还没有依赖项),您可以在* nix之类的环境中尝试执行以下操作: $ sudo apt-get install php7.1-xml php7.1-mb