文件名称:Ansj中文分词(强大)
文件大小:13.32MB
文件格式:ZIP
更新时间:2016-07-11 04:55:16
Ansj中文分词
Ansj中文分词是一款纯Java、主要用于自然语言处理、高精度的中文分词工具,目标是“准确、高效、*地进行中文分词”。 内容简介:http://www.iteye.com/magazines/102#234 此分词具有自己学习的功能,所以拜托大家不要.乱提交数据.会带坏人家的.说着神秘.其实是一种机器学习动态规划模型!如果你发现此模式分词存在问题.可以看.新词发现.是此分词的初始版本! 此分词保证了准确率,具有人名识别的功能! 此分词结果,具有新词发现,人名识别,机构名识别.也许准确率稍差.但是非常具有应用价值! 献给广大使用lucene要求高召回率的同学.没什么技术含量.但是很实用!
【文件预览】:
ansj_seg-master
----test()
--------library.properties(71B)
--------org()
----build.xml(1KB)
----library()
--------userLibrary()
--------user2.dic(34B)
--------user1.dic(36B)
----License.txt(11KB)
----dist()
--------ans_seg-20130615.jar(5.74MB)
--------ansj_lucene_3x_plug.jar(16KB)
----src()
--------library.properties(71B)
--------org()
----.gitignore(186B)
----lib()
--------tree-split-word.jar(27KB)
----README.md(5KB)