文件名称:csharp仿爬虫抓取网页内容
文件大小:4.83MB
文件格式:RAR
更新时间:2018-04-22 11:55:01
spider,正则
csharp仿爬虫抓取网页内容,本项目以抓取招聘网站公司内容为例,里面的去内容的正则表达式需要定期更新,否则抓不到;里面还有每天检测是否能抓到,抓不到则说明网站有更新,需要修改
【文件预览】:
HQ.Spider
----HQ.Spider.sln(996B)
----packages()
--------repositories.config(128B)
--------RestSharp.105.0.1()
--------Topshelf.3.1.4()
--------log4net.2.0.3()
----HQ.Spider.v12.suo(57KB)
----HQ.Spider()
--------Service.cs(6KB)
--------ChinaHrNetDeal.cs(4KB)
--------packages.config(275B)
--------StrHelperUtil.cs(4KB)
--------Program.cs(1KB)
--------NetDealBase.cs(5KB)
--------ZhiLianNetDeal.cs(5KB)
--------Test.cs(5KB)
--------Properties()
--------NetPostion.cs(1KB)
--------App.config(839B)
--------GetContentFromWeb.cs(7KB)
--------log4net.config(2KB)
--------HQ.Spider.csproj(3KB)
--------obj()
--------FiveJobNetDeal.cs(5KB)
--------bin()