文件名称:word分词器java源码-RAKE-Java:快速自动关键字提取框架(RAKE)的Java实现
文件大小:25KB
文件格式:ZIP
更新时间:2024-06-25 16:03:16
系统开源
word分词器java源码RAKE-Java 快速自动关键字提取 (RAKE) 算法的 Java 8 实现,如:Rose, S.、Engel, D.、Cramer, N. 和 Cowley, W. (2010) 中所述。 从单个文档中自动提取关键字。 在 MW Berry & J. Kogan(编辑),文本挖掘:理论和应用:John Wiley & Sons。 实现是基于 python 的(但是做了一些更改)源代码在 GPL V3License 下发布。 将此存储库添加到您的 POM.XML 是否要与 maven 一起使用 < repository > < id >galan-maven-repo</ id > < name >galan-maven-repo-releases</ name > < url >http://galan.ehu.es/artifactory/ext-release-local</ url > </ repository > 此实现需要使用 POS 标记器才能工作。 例如,伊利诺伊州词性标注器可用于英语。 对于西班牙语或其他语言: *灵 --> 或斯坦福
【文件预览】:
RAKE-Java-master
----.gitignore(31B)
----src()
--------main()
--------test()
----LICENSE(1KB)
----pom.xml(3KB)
----README.md(3KB)
----stopLists()
--------RakePunctDefaultStopList(31B)
--------SpanishCustomEs(1KB)
--------FoxStopListEn(2KB)
--------SmartStopListEn(4KB)