使用socket抓取网页源码

时间:2013-11-25 10:50:13
【文件属性】:
文件名称:使用socket抓取网页源码
文件大小:360KB
文件格式:ZIP
更新时间:2013-11-25 10:50:13
C#抓取网页 socket 获取网页源码 本人前面已经写了一个抓取网页的程序,准确性很高,但是没有蜘蛛的爬行功能,而且效率也不是怎么很理想;本人经过一段时间的研究,参考了其他高手的程序,然后自己写了一个网页抓取的,具有蜘蛛爬行功能,大家有兴趣可以去学习一下
【文件预览】:
模拟蜘蛛抓取网页
----自己模仿写了一个获取网页中的所有链接()
--------wfGetWebHref.suo(14KB)
--------wfGetWebHref.sln(926B)
--------wfGetWebHref()
----Crawler_src()
--------bin()
--------Crawler.csproj(5KB)
--------UpgradeLog.XML(980B)
--------res()
--------Crawler.suo(29KB)
--------_UpgradeReport_Files()
--------FileTypeForm.cs(9KB)
--------obj()
--------Settings.cs(7KB)
--------SettingsForm.cs(57KB)
--------AboutForm.resx(8KB)
--------FileTypeForm.resx(6KB)
--------Crawler.sln(898B)
--------BrowseForFolder.cs(494B)
--------AssemblyInfo.cs(2KB)
--------AboutForm.cs(3KB)
--------Crawler.csproj.user(2KB)
--------SettingsForm.resx(8KB)
--------MainForm.cs(171KB)
--------SortTree.cs(6KB)
--------MainForm.resx(46KB)

网友评论

  • 需要自己修改
  • 好像看不了,咋回事
  • 好多bug,需要慢慢修改才能使用代码~~
  • 不是太好,不清析
  • 程序bug比较多,需要自己修改使用
  • 好像用不了,关键代码部份无效
  • 正解,甚至可以反解淘宝和网易的代码