网络爬虫源代码

时间:2018-06-07 16:02:10
【文件属性】:

文件名称:网络爬虫源代码

文件大小:1.89MB

文件格式:ZIP

更新时间:2018-06-07 16:02:10

网络爬虫

网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。,信息检索,源代码vc++


【文件预览】:
Crawler
----NetCrawler.ncb(121KB)
----ProjectDlg.cpp(4KB)
----www.pudn.com.txt(218B)
----DownloadData.cpp(4KB)
----MainThread.cpp(14KB)
----NetCrawlerDlg.h(3KB)
----NetCrawler.plg(800B)
----ReadMe.txt(4KB)
----ProjectDlg.h(2KB)
----DownloadData.h(3KB)
----res()
--------NetCrawler.rc2(402B)
--------Thumbs.db(3KB)
--------NetCrawler.ico(1KB)
----NetCrawler.cpp(3KB)
----NetCrawler.rc(7KB)
----Release()
--------DownloadData.obj(11KB)
--------NetCrawler.pch(5.43MB)
--------NetCrawler.obj(12KB)
--------ProjectDlg.obj(12KB)
--------NetCrawler.exe(36KB)
--------vc60.idb(57KB)
--------StdAfx.obj(786B)
--------NetCrawler.res(4KB)
--------NetCrawlerDlg.obj(25KB)
--------MainThread.obj(32KB)
----NetCrawler.aps(22KB)
----NetCrawler.dsw(545B)
----NetCrawler.dsp(5KB)
----Resource.h(1KB)
----StdAfx.cpp(212B)
----NetCrawler.opt(51KB)
----NetCrawlerDlg.cpp(7KB)
----MainThread.h(2KB)
----StdAfx.h(1KB)
----NetCrawler.clw(3KB)
----NetCrawler.h(2KB)

网友评论