文件名称:文本相似度系统-java版本
文件大小:46.37MB
文件格式:RAR
更新时间:2020-02-10 05:35:00
文本相似度
java实现的文本相似度系统,使用向量空间模型以及余弦相似度距离公式,实测可以实现2篇文本的相似度计算且有一定的效果。
【文件预览】:
DocDistance
----bin()
--------word2vec()
--------util()
--------script()
--------algorithm()
----brand_ext.dic(10KB)
----style_ext.dic(12KB)
----product_ext.dic(4KB)
----Readme.txt(664B)
----stopword.dic(18KB)
----data()
--------test()
--------result()
----model()
--------vectors.bin(47.97MB)
----.settings()
--------org.eclipse.core.resources.prefs(138B)
--------org.eclipse.jdt.core.prefs(598B)
----src()
--------word2vec()
--------util()
--------script()
--------algorithm()
----.project(387B)
----ext.dic(166B)
----material_ext.dic(756B)
----.classpath(395B)
----color_ext.dic(1KB)
----lib()
--------IKAnalyzer2012_u6.jar(1.11MB)
----main2015.dic(448KB)
----IKAnalyzer.cfg.xml(773B)