网络蜘蛛网络爬虫(搜素引擎)

时间:2012-03-26 14:17:26
【文件属性】:

文件名称:网络蜘蛛网络爬虫(搜素引擎)

文件大小:52KB

文件格式:EXE

更新时间:2012-03-26 14:17:26

网络蜘蛛

网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。


网友评论

  • 挺好的,实用。
  • 代码的注释在详细点就更好
  • java源码,适合新手学习
  • 初级学习版,THANKS
  • java的源码,适合我这样的初学者。
  • 这是一个能运行的爬虫程序,可以直接爬取网页,但是没有代码呀!
  • 好,java的源码,适合我这样的初学者。
  • java的源码,适合我这样的初学者。网上有自己动手写爬虫程序 的书看看!