文件名称:搜索引擎技术基础 谷歌技术
文件大小:1.26MB
文件格式:PPT
更新时间:2014-05-28 17:48:42
搜索 引擎
1.静态网页:爬虫从一个或若干初始网页的URL开始,获得初始网页 2.动态网页:分析动态网页参数,按照一定规章,“拼”出所有要被抓取 3.特殊内容:比如RSS、
文件名称:搜索引擎技术基础 谷歌技术
文件大小:1.26MB
文件格式:PPT
更新时间:2014-05-28 17:48:42
搜索 引擎
1.静态网页:爬虫从一个或若干初始网页的URL开始,获得初始网页 2.动态网页:分析动态网页参数,按照一定规章,“拼”出所有要被抓取 3.特殊内容:比如RSS、