文件名称:ik-analyzer:从 code.google.compik-analyzer 自动导出
文件大小:6.71MB
文件格式:ZIP
更新时间:2024-07-02 08:39:10
Java
ik-analyzer Automatically exported from code.google.com/p/ik-analyzer IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。在2012版本中,IK实现了简单的分词歧义排除算法,标志着IK分词器从单纯的词典分词向模拟语义分词衍化。 IK Analyzer 2012特性: 1.采用了特有的“正向迭代最细粒度切分算法“,支持细粒度和智能分词两种切分模式; 2.在系统环境:Core2 i7 3.4G双核,4G内存,wi
【文件预览】:
ik-analyzer-master
----.project(391B)
----README.md(1KB)
----bin()
--------IKAnalyzer.cfg.xml(424B)
----test()
--------mydict.dic(3B)
--------org()
--------CH_stopword.dic(4KB)
----.settings()
--------org.eclipse.core.resources.prefs(88B)
--------org.eclipse.jdt.core.prefs(629B)
----apache-solr-core-1.4.0.jar(1.07MB)
----src()
--------lucene-smartcn-3.0.1.jar(3.42MB)
--------lucene-analyzers-3.0.1.jar(196KB)
--------org()
--------ext_stopword.dic(161B)
--------IKAnalyzer.cfg.xml(423B)
----lucene-core-3.0.0.jar(998KB)
----junit.jar(118KB)
----.classpath(584B)