网络爬虫技术 网络爬虫框架

时间:2013-01-03 07:32:14
【文件属性】:

文件名称:网络爬虫技术 网络爬虫框架

文件大小:88KB

文件格式:DOC

更新时间:2013-01-03 07:32:14

网络爬虫

 引言  随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(Search Engine),例如传统的通用搜索引擎AltaVista,Yahoo!和Google等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性,如:


网友评论