文件名称:基于Hadoop的文本相似度计算
文件大小:2.02MB
文件格式:ZIP
更新时间:2016-07-01 14:38:48
Hadoop 文本相似度 TFIDF 向量空间莫新
基于Hadoop的文本相似度计算的代码
是用TFIDF 和向量空间模型,IKAnlayze来弄的
有代码,只是用来参考的
只是一个算法的演示,用于保存,以后查看的
【文件预览】:
Similarity
----.project(421B)
----ext.dic(1.64MB)
----src()
--------com()
----stopword.dic(7KB)
----IKAnalyzer2012.jar(1.11MB)
----.classpath(5KB)
----bin()
--------com()