文件名称:rake:用于快速自动关键字提取(RAKE)的Java库
文件大小:10KB
文件格式:ZIP
更新时间:2024-02-21 10:40:46
java algorithm jvm extraction rake
快速自动关键字提取(RAKE) RAKE是一种算法,用于从文档中提取与文档内容具有高度相关性或重要性的关键字(从技术上讲是短语,但我不质疑科学文献)。 例如,文本中的前五个重要关键字: 线性约束系统在自然数集上的兼容性。 考虑了线性丢番图方程组,严格不等式和非严格不等式的相容性准则。 给出了针对所有类型系统的最小解集的组成部分的上限以及构造最小解集的构建算法。 这些标准和用于构造解决方案的最小支持集的相应算法可用于解决所有考虑的系统类型和混合类型的系统。 计算为: 关键词 关联 线性双色子方程 10.666 最小发电机组 10.333 最小支持集 8.833 上限 6.0 自然数 6.0 正在安装 该库尚未在*存储库中,因此请从发布页面中获取JAR URL,并将其扔到您正在使用的任何依赖项管理器中。 那,或者只是下载JAR。 使用API 使用该库非常简单。 主类仅导出一个公共方法getKeywordsFromText() ,并且需要语言代码才能运行。 在RakeLanguages找到的任何常量都可以RakeLanguages地使用。 因此,例如: public c
【文件预览】:
rake-master
----vendor()
--------apache-commons()
----rake.iml(688B)
----data()
--------BUCK(278B)
----LICENSE(1KB)
----src()
--------main()
----BUCK(215B)
----.gitignore(3KB)
----.buckconfig(107B)
----README.md(3KB)