论文研究-基于特征码的网页排重算法的设计与实现 .pdf 时间:2022-09-04 04:41:27 【文件属性】: 文件名称:论文研究-基于特征码的网页排重算法的设计与实现 .pdf 文件大小:178KB 文件格式:PDF 更新时间:2022-09-04 04:41:27 网页去重 基于特征码的网页排重算法的设计与实现,刘新生,厉锟,在大规模新闻抓取中,大量重复或者近似文章也频繁出现,这影响了抓取系统的性能,同时也降低了新闻抓取质量,所以有必要在系统中 立即下载