文件名称:c++实现的网络爬虫
文件大小:214KB
文件格式:GZ
更新时间:2013-05-18 11:35:33
网络爬虫
c++实现的网络爬虫,代码封装的很好,有C++基础和数据结构和网络协议基础的人,很容易看懂。
【文件预览】:
tse
----Main.cpp(1KB)
----Url.cpp(12KB)
----DataEngine.h(505B)
----Md5.cpp(9KB)
----tfind.cpp(2KB)
----Crawl.h(2KB)
----Clean.sh(329B)
----Http.cpp(21KB)
----Rules.make(511B)
----tse_seed.robots(32B)
----tse_seed.pku.bak(1KB)
----tse_seed.pku(9KB)
----Url.h(2KB)
----Stat.cpp(1KB)
----FileEngine.cpp(558B)
----CommonDef.h(899B)
----Md5.h(1KB)
----Page.h(3KB)
----IsamFile.cpp(3KB)
----seed(1KB)
----StrFun.cpp(2KB)
----DataEngine.cpp(145B)
----StrFun.h(858B)
----Http.h(567B)
----include()
--------uri.h(2KB)
--------hlink.h(598B)
--------stack.h(1KB)
--------misc.h(840B)
--------list.h(6KB)
----IsamFile.h(527B)
----Page.cpp(24KB)
----TianwangFile.h(391B)
----pku.hosts(7KB)
----Link4SEFile.cpp(1KB)
----remind.txt(1KB)
----tse_seed.img(385B)
----Tse.h(4KB)
----hlink()
--------hlink.h(598B)
--------lex.hlink.o(107KB)
--------hlink.l.0(7KB)
--------lex.hlink.c(344KB)
--------hlink.l(8KB)
--------hlink.l.bak(8KB)
--------Makefile(241B)
----Link4SEFile.h(383B)
----seeds(1KB)
----TianwangFile.cpp(1KB)
----Search.h(252B)
----Res.cpp(2KB)
----tfindForeign.cpp(1KB)
----FileEngine.h(553B)
----Search.cpp(5KB)
----DatabaseEngine.cpp(138B)
----README(4KB)
----uri()
--------uri.h(2KB)
--------lex.uri.o(34KB)
--------.uri.h.swp(12KB)
--------uri.l(31KB)
--------lex.uri.c(114KB)
--------Makefile(204B)
----Crawl.cpp(36KB)
----tse_unreachHost.list(1KB)
----tse_ipblock(0B)
----Design-doc.txt(249B)
----tse_seed.net(234B)
----DatabaseEngine.h(301B)
----tse_seed.gh(18B)
----Makefile(2KB)
----lib()
--------stack.h(1KB)
--------misc.h(840B)
--------stack.o(1KB)
--------list.h(6KB)
--------stack.c(4KB)
--------Makefile(196B)
--------misc.o(844B)
--------misc.c(226B)
----stack()
--------stack.h(1KB)
--------stack.o(1KB)
--------stack.c(4KB)
--------Makefile(132B)