中文文本相似度匹配算法

时间:2021-08-03 17:48:20
【文件属性】:

文件名称:中文文本相似度匹配算法

文件大小:4.73MB

文件格式:RAR

更新时间:2021-08-03 17:48:20

simHash 海明距离 中文文本 相似度匹配

中文文本相似度匹配算法 simHash 海明距离 IK分词 完整的可运行的示例代码 包含simHash 算法,使用IK 对中文文本进行分词处理


【文件预览】:
IKAnalyzer_all_jar
----lucene-core-4.3.0.jar(2.11MB)
----lucene-analyzers-common-4.3.0.jar(1.49MB)
----IKAnalyzer2012_u6.jar(1.11MB)
----lucene-queryparser-4.3.0.jar(377KB)

网友评论