VSM信息检索模型(向量空间模型)

时间:2015-07-01 10:59:45
【文件属性】:

文件名称:VSM信息检索模型(向量空间模型)

文件大小:1.87MB

文件格式:RAR

更新时间:2015-07-01 10:59:45

向量空间模型 VSM JAVA

向量空间模型(VSM)的JAVA实现,从文档表示到相似度计算,使用两种相似度计算方式:cos和tf-idf算法


【文件预览】:
src
----Term.java(509B)
----DocSimilarity.java(164B)
----ChineseStopWords.txt(3KB)
----edited1988.txt(6.09MB)
----Doc.java(334B)
----Similarity.java(11KB)

网友评论

  • 很不错的资源,有很大帮助,好评
  • 很好,对项目很有帮助
  • 挺好的,值得借鉴
  • 收藏,谢谢分享!
  • 很好,对项目的编写很有帮助,正是我想要的,谢谢
  • 感觉注释少了点 其他还不错
  • 额,没认真看,原来是文本相似度计算,以为是信息检索一整套东西~
  • 不错的资源,可以下载下来学习
  • 帮助很大的文档,谢谢分享
  • 直接跑下来有错误,setArticleMap()中的lineCounter++;那句,其他的还没试,不错
  • 初步感觉不错
  • 有异常(Docs.get(currentArticleKey).length),未考虑termArray去除stopword后长度为0的情况;整体不错
  • 挺好的,值得借鉴,谢谢
  • 注释少的可怜啊,对初学vsm的有难度啊
  • 谢谢分享 值得参考
  • 挺好的,用了
  • 虽然注释比较少,但是认真看了好几天还是看懂了。
  • 运行提示TreeMap异常
  • 能用,虽然有点复杂,但是还是有帮助的!
  • 已经用到了,感觉这个模型挺好的,谢谢分享
  • 可以运行,注释比较少,需要好好研究。值得借鉴
  • 还不错,可以借鉴参考下
  • VSM模型作为用途最广泛的文本转化模型,要好好研究下
  • 很有参考意义,要是注释再详细点就更好了,运行提示TreeMap异常
  • 有一些小错误,修改后可以用,但是没有分词
  • 注释的确很少,困难
  • 谢谢分享,还是有参考价值的。
  • 正在研究,注释有点少
  • 已经用到了,感觉这个模型挺好的,谢谢分享
  • 不错,有看点,有意思