csharp仿爬虫抓取网页内容

时间:2018-04-22 11:55:01
【文件属性】:

文件名称:csharp仿爬虫抓取网页内容

文件大小:4.83MB

文件格式:RAR

更新时间:2018-04-22 11:55:01

spider,正则

csharp仿爬虫抓取网页内容,本项目以抓取招聘网站公司内容为例,里面的去内容的正则表达式需要定期更新,否则抓不到;里面还有每天检测是否能抓到,抓不到则说明网站有更新,需要修改


【文件预览】:
HQ.Spider
----HQ.Spider.sln(996B)
----packages()
--------repositories.config(128B)
--------RestSharp.105.0.1()
--------Topshelf.3.1.4()
--------log4net.2.0.3()
----HQ.Spider.v12.suo(57KB)
----HQ.Spider()
--------Service.cs(6KB)
--------ChinaHrNetDeal.cs(4KB)
--------packages.config(275B)
--------StrHelperUtil.cs(4KB)
--------Program.cs(1KB)
--------NetDealBase.cs(5KB)
--------ZhiLianNetDeal.cs(5KB)
--------Test.cs(5KB)
--------Properties()
--------NetPostion.cs(1KB)
--------App.config(839B)
--------GetContentFromWeb.cs(7KB)
--------log4net.config(2KB)
--------HQ.Spider.csproj(3KB)
--------obj()
--------FiveJobNetDeal.cs(5KB)
--------bin()

网友评论

  • 大部分都是封装的 没有价值 没什么用