文件名称:ansj_seg_lanjing:ansj_seg + lucene by 松哥
文件大小:43.84MB
文件格式:ZIP
更新时间:2024-08-02 21:10:13
Java
Ansj中文分词
#####使用帮助
#####在线测试地址
摘要
这是一个基于google语义模型+条件随机场模型的中文分词的java实现.
分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上
目前实现了.中文分词. 中文姓名识别 . 用户自定义词典
可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目.
下载jar
访问 最好下载最新版 ansj_seg/
如果你用的是1.x版本需要下载。
如果你用的是2.x版本需要下载
导入到eclipse ,开始你的程序吧
maven
第一步在你的pom.xml中加入.