文件名称:这就是搜索引擎
文件大小:43.14MB
文件格式:PDF
更新时间:2022-05-17 05:37:51
搜索引擎 张俊林 带书签
这就是搜索引擎 核心技术详解 张俊林 著 带书签 这本书是写给谁的 如果您是下列人员之一,那么本书就是写给您的。 1. 对搜索引擎核心算法有兴趣的技术人员 • 搜索引擎的整体框架是怎样的?包含哪些核心技术? • 网络爬虫的基本架构是什么?常见的爬取策略是什么?什么是暗网爬取?如何构建 分布式爬虫?百度的阿拉丁计划是什么? • 什么是倒排索引?如何对倒排索引进行数据压缩? . 搜索引擎如何对搜索结果排序? • 什么是向量空间模型?什么是概率模型?什么是BM25 模型?什么是机器学习排 序?它们之间有何异同? • PageRank 和田rs 算法是什么关系?有何异同? SALSA 算法是什么? Hilltop 算法又 是什么?各种链接分析算法之间是什么关系? • 如何识别搜索用户的真实搜索意图?用户搜索目的可以分为几类?什么是点击图? 什么是查询会话?相关搜索是如何做到的? • 为什么要对网页进行去重处理?如何对网页进行去重?哪种算法效果较好? 搜索引擎缓存有几级结构?核心策略是什么? 什么是情境搜索?什么是社会化搜索?什么是实时搜索? 2. 对云计算与云存储有兴趣的技术人员 • 什么是CAP 原理?什么是ACID 原理?它们之间有什么异同? • Google 的整套云计算框架包含哪些技术? Hadoop 系列和Google 的云计算框架是什么 关系? Goo剖e 的三驾马车GFS、BigTable、MapReduce 各自代表什么含义?是什么关系? • Google 的咖啡因系统的基本原理是什么? • Google 的Pregel 计算模型和MapReduce 计算模型有什么区别? Google 的Megastore 云存储系统和BigTable 是什么关系? • 亚马逊公司的时namo 系统是什么? 3. 从事搜索引擎优化的网络营销人员及中小网站站长 • 搜索引擎的反作弊策略是怎样的?如何进行优化避免被认为是作弊? . 搜索引擎如何对搜索结果排序?链接分析和内容排序是什么关系? • 什么是内容农场?什么是链接农场?它们是什么关系? 什么是Web2.0 作弊?有哪些常见手法? 什么是SpamRank?什么是Trus由ank?什么又是BadRank?它们是什么关系? 咖啡因系统对网页排名有何影响?