搜索引擎页面排序算法研究综述

时间:2014-04-21 06:35:22
【文件属性】:

文件名称:搜索引擎页面排序算法研究综述

文件大小:242KB

文件格式:PDF

更新时间:2014-04-21 06:35:22

搜索引擎 页面排序 算法

系统地分析了现有的页面排序算法,指出了它们各自的优势和存在的不足,并指出不闻算法在不同领 域和场合所具有的优势。建立专业搜索引擎是提高搜索准确性和性能的有效途径。通过网格技术将各种专业 搜索引擎集成在一起,形成一个基于网格的搜索引擎,从而更好地满足不同背景不同偏好的用户需求。 随着Intemet的飞速发展,其提供的文档(网页)也以惊人 的速度在增长。有关的调查统计表明,Intemet上的网页每不 到一年的时间就会增长一倍。要从这么大量的信息库中提取 出有用的信息就越来越依赖于搜索引擎的功能。而网页的排 序则是搜索引擎要解决的关键问题之一。 Sergey Brin等人 提出PageRank算法开启了链接分析研 究的热潮。基于链接分析的算法,提供了一种衡量网页质量的 客观方法;独立于语言,独立于内容;无需人工干预就能自动发 现Web上的重要资源,挖掘出Web上的重要社区,自动实现文 档分类。PageRank在Google中的应用获得了巨大的商业成 功。在最初的Google中,首先使用IR(Information Retrieve)算 法找到所有与查询关键字相匹配的网页;然后根据页面因素 (标题、关键字密度等)进行排名;最后通过PageRank得分调 整网站排名结果。


网友评论

  • 一个综述类的介绍,到时不错
  • 挺好的,一个大致的介绍
  • 论文不错~如果楼主配上可以执行的算法或者程序就更好了!
  • 质量不错,可以用来入门看看。