Ansj中文分词(强大)

时间:2016-07-11 04:55:16
【文件属性】:

文件名称:Ansj中文分词(强大)

文件大小:13.32MB

文件格式:ZIP

更新时间:2016-07-11 04:55:16

Ansj中文分词

Ansj中文分词是一款纯Java、主要用于自然语言处理、高精度的中文分词工具,目标是“准确、高效、*地进行中文分词”。 内容简介:http://www.iteye.com/magazines/102#234 此分词具有自己学习的功能,所以拜托大家不要.乱提交数据.会带坏人家的.说着神秘.其实是一种机器学习动态规划模型!如果你发现此模式分词存在问题.可以看.新词发现.是此分词的初始版本! 此分词保证了准确率,具有人名识别的功能! 此分词结果,具有新词发现,人名识别,机构名识别.也许准确率稍差.但是非常具有应用价值! 献给广大使用lucene要求高召回率的同学.没什么技术含量.但是很实用!


【文件预览】:
ansj_seg-master
----test()
--------library.properties(71B)
--------org()
----build.xml(1KB)
----library()
--------userLibrary()
--------user2.dic(34B)
--------user1.dic(36B)
----License.txt(11KB)
----dist()
--------ans_seg-20130615.jar(5.74MB)
--------ansj_lucene_3x_plug.jar(16KB)
----src()
--------library.properties(71B)
--------org()
----.gitignore(186B)
----lib()
--------tree-split-word.jar(27KB)
----README.md(5KB)

网友评论

  • 还不错,就是词库稍微旧了,很多词语分得不是很理想
  • 还不错吧,但是没咋么研究
  • 是分词的都下载看看,多学多看
  • 还不错,后来一直用,词库邵了点
  • 很好,谢谢!!
  • 可以当作jar包用
  • 不错很好用
  • 使用非常方便
  • 因为是Java编写的,所以比NLPIR用着方便
  • 非常不错,很好。
  • ansj分词发确实不错,力挺
  • 很好用~~~!!!
  • 很不错,提取文章关键词效果很好,谢谢楼主!代码留着慢慢学习!
  • 非常的好用,感谢楼组,感谢你全家奥~~~~~yamad
  • ansj准确率很高,很强大。赞,谢谢分享
  • 还可以,可以用来练习。只是包有些老
  • 资源很好,谢谢分享
  • 这个不错 很有用。。
  • 很强大的分词!必须赞!
  • ANSJ性能还是不错的,对于未登录词也有一定的识别能力
  • 很有用,谢谢分享
  • 资源很强大,但是没用上。看来,我要努力了。
  • 不错 ,项目中用到了。
  • ansj挺好的,在改良的基础上做的,只是初始化的速度有点慢
  • 不太懂所讲内容
  • 可惜没有配成功
  • 看不太懂,谢谢分享
  • 不太懂所讲内容