文件名称:c#网页采集自动入库程序
文件大小:173KB
文件格式:RAR
更新时间:2010-12-14 14:46:58
抓取 抓取网页 网页采集 自动入库
功能:
1 自动抓取网页链接
2 对网页链接进行查重、排序、筛选,鼠标+shift多选,鼠标+alt多个删除
3 读入链接文件对其自动另存
4 对文件按照内容源代码进行截取后自动入库
5 自动判断下一页链接来自动导入链接
6 在网页中利用正则表达式来进行特殊数据的抓取
7 批量生成链接
8 网页载入完毕后始终在本窗体打开,不会弹出新窗口,对需要登录的网页抓取很有用。
【文件预览】:
indb
----FrmRegistration.Designer.cs(10KB)
----Form3.Designer.cs(4KB)
----downAsp.cs(605B)
----frmIni.resx(37KB)
----Form1.cs(103KB)
----SearchAndReplace.resx(6KB)
----InDb.csproj(7KB)
----autoRexLink.Designer.cs(9KB)
----autoLink.resx(29KB)
----Settings.cs(1KB)
----FrmRegistration.cs(5KB)
----Program.cs(3KB)
----autoRexLink.resx(6KB)
----Download Drive 1.ico(15KB)
----recoverFileDir.cs(3KB)
----Form1.Designer.cs(102KB)
----frmIni.cs(366B)
----autoLink.Designer.cs(12KB)
----Form3.cs(1KB)
----frmIni.Designer.cs(2KB)
----Form3.resx(6KB)
----Form1.resx(130KB)
----FrmLinkShow.Designer.cs(3KB)
----app.config(385B)
----openDB.cs(575B)
----FrmLinkShow.resx(28KB)
----FrmLinkShow.cs(656B)
----autoLink.cs(8KB)
----InDb.csproj.user(561B)
----InterScptStr.cs(5KB)
----SearchAndReplace.Designer.cs(8KB)
----insertDB.cs(2KB)
----ClassDiagram1.cd(3KB)
----SearchAndReplace.cs(12KB)
----autoRexLink.cs(3KB)
----logo_title.gif(21KB)
----FrmRegistration.resx(6KB)