文件名称:ICTCLAS30汉语分词
文件大小:6.29MB
文件格式:RAR
更新时间:2012-08-19 03:22:47
ICTCLAS
中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45%,API不超过200KB,各种词典数据压缩后不到3M,是当前世界上最好的汉语词法分析器。
【文件预览】:
windows_c_32
----windows_C_32()
--------bin()
--------api()
--------readme.txt(5KB)
--------doc()
--------sample()