ASP.NET网页抓取功能

时间:2014-01-13 09:06:19
【文件属性】:

文件名称:ASP.NET网页抓取功能

文件大小:165KB

文件格式:ZIP

更新时间:2014-01-13 09:06:19

WEB,AJAX,c#,抓取

项目结构说明: \ ……\App_Data 项目数据库文件 (ACCESS2003) ……\bin\ …………\AjaxPro.2.dll .NET调用AJAX类库 …………\App_Code.dll 功能类文件 …………\App_Web_ka4newz2.dll *.aspx.cs文件打包 ……\JS\ …………\jquery-1.4.4.min.js JQuery库 …………\Script 系统自定义JS文件 ……\Default.aspx 系统功能页面 ……\Help.txt 帮助文档 ……\web.config 配置文件 ……\PrecompiledApp.config 发布配置文件 系统使用说明: 一、系统启动后在“抓取网页路径” 输入要抓取网页的URL 以文本内默认格式输入 选择“网页编码格式” (如果不知道网页格式可以更换不同选择项),然后点击“测试打开网页”。系统会 在页面右侧空白处显示页面源码,以及以小窗口形式显示要抓取的网页可视化界面。 二、在“列表定位标签”输入要抓取列表信息容器型标签。例如:DIV、UL、TABLE “筛选同类标签”作用是用来过滤页面上同类定位标签,然后点击“测试列表定位” 三、“抓取信息标签”是指列表后页面中要制定抓取的信息容器型标签。(如果抓取整页信息请为空),然后点 击“开始抓取列表内容”。 四、当抓取记录操作中出现抓取日志时。网页HTML字符串已经保存完毕。可是图片可能还在陆续保存。由于是WEB 形式所以无法得知何时抓取完毕,用户需长时间进程守候。 五、“获取抓取页面打包”是先前抓取的网页以及图片打包 六、项目DOWNLOADS中分HTML、IMAGES是保存抓取网页的信息 系统问题: 系统对网速要求很高,因为下载图片是多线程。 B/S模式程序响应可能超时而影响系统正常运行。


【文件预览】:
WebSite
----aspnet_client()
--------system_web()
----App_Code()
--------CommandInfo.cs(2KB)
--------MyHttpWebRequest.cs(3KB)
--------T_Config.cs(11KB)
--------T_Pick.cs(12KB)
--------PubConstant.cs(1KB)
--------DbHelperSQL.cs(35KB)
--------Loger.cs(2KB)
--------DESEncrypt.cs(3KB)
--------MyWinRAR.cs(2KB)
----Themes()
--------garland()
----web.config(8KB)
----JS()
--------jquery-1.4.4.min.js(77KB)
--------Script.js(13KB)
----Set.aspx(10KB)
----App_Data()
--------#Y$@!X#.mdb(356KB)
----Pick.aspx.cs(13KB)
----Pick.aspx(11KB)
----Help.txt(2KB)
----Set.aspx.cs(4KB)
----Modules()
--------system()
--------book()
--------poll()
--------user()
--------aggregator()
--------comment()
--------node()
----Bin()
--------AjaxPro.2.dll(128KB)
----DownLoads()

网友评论

  • Dll缺失啊,不是太好
  • 跟上一个一样,不怎么样