网页查重算法Shingling和Simhash研究

时间:2015-11-07 04:19:28
【文件属性】:

文件名称:网页查重算法Shingling和Simhash研究

文件大小:107KB

文件格式:CAJ

更新时间:2015-11-07 04:19:28

网页查重算法 Shingling Simhash

对比介绍了网页查重算法Shingling和Simhash的优劣,提出了两者适用的不同领域,是文本相似度计算的重要参考资料


网友评论

  • 虽然最终没有派上用场,但还是感谢
  • 这是原文,很不错,感谢分享