文件名称:中文文本相似度匹配算法
文件大小:4.73MB
文件格式:RAR
更新时间:2021-08-03 17:48:20
simHash 海明距离 中文文本 相似度匹配
中文文本相似度匹配算法 simHash 海明距离 IK分词 完整的可运行的示例代码 包含simHash 算法,使用IK 对中文文本进行分词处理
【文件预览】:
IKAnalyzer_all_jar
----lucene-core-4.3.0.jar(2.11MB)
----lucene-analyzers-common-4.3.0.jar(1.49MB)
----IKAnalyzer2012_u6.jar(1.11MB)
----lucene-queryparser-4.3.0.jar(377KB)