基于Hadoop的文本相似度计算

时间:2016-07-01 14:38:48
【文件属性】:

文件名称:基于Hadoop的文本相似度计算

文件大小:2.02MB

文件格式:ZIP

更新时间:2016-07-01 14:38:48

Hadoop 文本相似度 TFIDF 向量空间莫新

基于Hadoop的文本相似度计算的代码
是用TFIDF 和向量空间模型,IKAnlayze来弄的
有代码,只是用来参考的
只是一个算法的演示,用于保存,以后查看的


【文件预览】:
Similarity
----.project(421B)
----ext.dic(1.64MB)
----src()
--------com()
----stopword.dic(7KB)
----IKAnalyzer2012.jar(1.11MB)
----.classpath(5KB)
----bin()
--------com()

网友评论

  • 有用,只是对于没有什么基础的我有点难
  • 真不错 ,帮了大忙了
  • 还是很有帮助的
  • 这个好,解决了大问题
  • 有用,但是没有看懂
  • 太厉害了 有点没有懂 还需要慢慢了解
  • 刚学完信息检索和hadoop 来看看怎么把两个知识结合在一起
  • 这个对我太有了,学历不够看起来费劲。学习了
  • 有用,但是没有看懂