文件名称:基于Socket的多线程C#爬虫程序
文件大小:444KB
文件格式:RAR
更新时间:2014-04-15 05:49:16
爬虫
这是一个C#实现的Web网页/网络爬虫程序(也叫网络蜘蛛或网络蚂蚁),它可以自动的对一个网站上的网页进行遍历,并自动下载。大多用于搜索引擎的前期数据获取,当然,也可以用来分析获取Email了
【文件预览】:
Crawler_demo.zip
Crawler_src.zip
Crawler.aspx_files
----logo225x90.gif(7KB)
----Requests.jpg(57KB)
----ForumClassic.css(7KB)
----oncopy.js(1KB)
----ServeThirdParty_data()
--------pageid6473564894.js(775B)
--------InsertFlash.js(3KB)
----AddTo_Simpy.png(595B)
----ServeThirdParty_data_003()
--------pageid4082160291.js(306B)
----ServeThirdParty_003.htm(1KB)
----Advanced.jpg(27KB)
----t.gif(43B)
----print.gif(186B)
----EG.gif(363B)
----t_002.gif(43B)
----CodeProject.css(26KB)
----AddTo_Technorati.png(468B)
----menu132_com.js(22KB)
----msg_joke.gif(659B)
----ajax-loader.gif(673B)
----pollcol.gif(134B)
----msg_answer.gif(955B)
----AddTo_Reddit.png(800B)
----forum_newmsg.gif(1KB)
----TopNavBar.js(5KB)
----AddTo_Furl.png(974B)
----member_sm.gif(133B)
----msg_rant.gif(1023B)
----TogglePre.js(3KB)
----ServeThirdParty_004.htm(1KB)
----DE70DBF1-48CE-462A-88A3-CBB50E4B4602.jpg(10KB)
----staff_sm.gif(561B)
----ga.js(20KB)
----AddTo_stumbleupon.png(1KB)
----watchon.png(548B)
----AddTo_Live.png(1KB)
----rateitem.js(2KB)
----minus.gif(846B)
----Connections.jpg(22KB)
----msg_news.gif(958B)
----ServeThirdParty_data_004()
--------pageid3571057533.js(300B)
----AddTo_Google.png(1KB)
----WebCrawlerArchitecture.png(28KB)
----fave.gif(267B)
----ServeThirdParty_005.htm(1KB)
----Matches.jpg(28KB)
----AddTo_Blink.png(966B)
----discuss.gif(286B)
----red.gif(77B)
----thumbs_down.gif(576B)
----forum_search.gif(974B)
----ServeThirdParty.htm(2KB)
----AddTo_Digg.png(940B)
----Threads.jpg(44KB)
----t.htm(1KB)
----prize_winner.gif(550B)
----Crawler.jpg(68KB)
----msg_admin.gif(1020B)
----mail.gif(270B)
----jxs.js(4KB)
----coffee.gif(619B)
----bookmark.js(2KB)
----AddTo_Delicious.png(222B)
----thumbs_up.gif(572B)
----ServeThirdParty_data_002()
--------pageid3532117455.js(308B)
----addto.js(5KB)
----smiley_smile.gif(1021B)
----report.gif(144B)
----ShortCuts.js(4KB)
----ServeThirdParty_002.htm(1KB)
----AddTo_Newsvine.png(131B)
----msg_general.gif(923B)
----AddTo_Facebook.png(959B)
----link.png(3KB)
----ServeThirdParty_data_005()
--------pageid6483715658.js(303B)
----Output.jpg(16KB)
----AddTo_Yahoo.png(968B)
----forum_faq.gif(1000B)
----AddTo_MrWong.png(642B)
----msg_question.gif(1KB)
Crawler.aspx.htm