文本相似度论文和网页查重

时间:2016-08-19 05:46:40
【文件属性】:

文件名称:文本相似度论文和网页查重

文件大小:30.75MB

文件格式:ZIP

更新时间:2016-08-19 05:46:40

相似度,查重

各种文本相似度论文,包含网页查重的论文。


【文件预览】:
文本相似度论文
----数据库设计-短文本比较.doc(11KB)
----WAND.pdf(243KB)
----Google SimHash如何查找重复网页.docx(108KB)
----短文本语言计算的关键技术研究_龚才春.caj(1.26MB)
----基于分词的中文文本相似度计算研究_沈斌 (1).caj(765KB)
----基于内容的搜索引擎网页去重研究_刘阳.caj(4.01MB)
----基于文本相似度计算的文本聚类算法研究与实现_耿倩.caj(1017KB)
----boolm filter算法.docx(88KB)
----LCS演算法-简介.ppt(761KB)
----MinHash最小哈希算法.docx(29KB)
----基于语义上的相似度()
--------基于概念相似度的文本相似计算_彭京.pdf(6.25MB)
----SimHash改进算法.docx(174KB)
----基于段落指纹的大规模近似网页检测算法研究_栾艳.caj(8.72MB)
----基于中文分词的文本相似度动态规划算法_肖侃.pdf(238KB)
----基于Lucene的中文自然语言搜索引擎_胡长春.caj(740KB)
----暴雪的Hash算法.docx(16KB)
----googleSimHash算法原理.docx(18KB)
----文本聚类.pdf(131KB)
----Rabin-Karp哈希算法.docx(25KB)
----基于LDA的中文文本相似度计算_孙昌年.pdf(474KB)
----Single算法.docx(34KB)
----readonline.caa(385B)
----LCS算法.docx(85KB)
----汉语词语及句子相似度算法研究与应用_刘青磊.caj(1.09MB)
----文本相似检测simhash等三种算法比较).docx(22KB)
----基于文本挖掘技术的论文抄袭判定研究_赵俊杰.caj(4.11MB)
----一种结合词项语义信息和TF_IDF方法的文本相似度量方法_黄承慧.pdf(719KB)
----基于分词的中文文本相似度计算研究_沈斌.caj(765KB)
----WordNet中基于IC的概念语义相似度算法_王艳娜.caj(1.28MB)
----模糊聚类.pdf(129KB)
----重复数据删除技术 (1).pdf(945KB)
----基于多SimHash指纹的近似文本检测_董博.pdf(460KB)
----文本聚类思路.doc(48KB)
----短文本去重.docx(14KB)
----基于句子相似度的文本比对算法研究_杨茂.caj(1.23MB)

网友评论

  • 大体看了一下,基本还可以,有用。