文件名称:java版结巴分词工具
文件大小:3.91MB
文件格式:ZIP
更新时间:2020-12-19 14:19:12
结巴分词
java版结巴分词工具,一个很好的中文分词工具。直接用eclipse打开,输入是一篇文章,然后输出是每个词的词频,并且词频是按照大小从次数最高到次数最低排的,只需要在test包里改部分代码就可以使用了。 不下你会后悔的。
【文件预览】:
JBFC
----bin()
--------prob_emit.txt(650KB)
--------jieba.java.code.style.xml(35KB)
--------test()
--------com()
--------dict.txt(4.84MB)
----.settings()
--------org.eclipse.jdt.core.prefs(598B)
----src()
--------prob_emit.txt(650KB)
--------jieba.java.code.style.xml(35KB)
--------test()
--------com()
--------dict.txt(4.84MB)
----.project(380B)
----.classpath(301B)