中文文本相似度匹配算法 simHash 海明距离 IK分词

时间:2020-12-07 03:58:19
【文件属性】:

文件名称:中文文本相似度匹配算法 simHash 海明距离 IK分词

文件大小:4.73MB

文件格式:RAR

更新时间:2020-12-07 03:58:19

simHash 海明距离 IK分词

中文文本相似度匹配算法 simHash 海明距离 IK分词 完整的可运行的示例代码 包含simHash 算法,使用IK 对中文文本进行分词处理


【文件预览】:
IKAnalyzer_all_jar
----IKAnalyzer2012_u6.jar(1.11MB)
----lucene-analyzers-common-4.3.0.jar(1.49MB)
----lucene-queryparser-4.3.0.jar(377KB)
----lucene-core-4.3.0.jar(2.11MB)

网友评论

  • 赞一个,这个加上了中文分词器。其余功能是网上可以找到的