【文件属性】:
文件名称:TextRank:适用于PHP8的TextRank(自动文本摘要)
文件大小:32KB
文件格式:ZIP
更新时间:2021-02-02 12:58:30
search php science algorithm textrank
文字排名
此源代码是PHP7严格模式下TextRank算法(自动汇总)的实现。 它可以将文本,文章总结为一个简短的段落。 在开始汇总之前,它会删除在Stopwords命名空间中定义的垃圾字。 可以用其他语言扩展它。
TextRank或自动汇总
自动汇总是使用计算机程序缩减文本文档以创建保留原始文档最重要要点的摘要的过程。 可以做出连贯摘要的技术会考虑变量,例如长度,写作风格和语法。 自动数据汇总是机器学习和数据挖掘的一部分。 汇总的主要思想是找到数据的代表性子集,其中包含整个集合的信息。 当今,汇总技术已在许多行业中使用。 -*
此实现的算法为:
查找句子
删除停用词,
通过查找并计算匹配的单词来创建整数值,
通过相关单词的整数值更改整数值,
标准化值以创建分数,
分数排序
安装
composer require php-science/textrank
测试
cd project-folder
composer test
要么
cd project-folder
phpunit --colors='always' $(pwd)/tests
例子
use PhpSci
【文件预览】:
TextRank-master
----.gitignore(58B)
----README.md(3KB)
----.github()
--------workflows()
----tests()
--------TextRankFacadeTest.php(4KB)
----phpunit.xml(805B)
----LICENSE(1KB)
----composer.json(718B)
----src()
--------TextRankFacade.php(7KB)
--------Tool()
----res()
--------sample1.txt(2KB)