Soukey采摘网站数据采集软件

时间:2012-09-03 04:13:04
【文件属性】:

文件名称:Soukey采摘网站数据采集软件

文件大小:1.03MB

文件格式:RAR

更新时间:2012-09-03 04:13:04

Soukey,采集,数据下载

一个开源免费的网站数据采集软件,支持多任务,多线程数据采集,遵循BSD协议。运行环境需:Microsoft .net Framework 2.0 1、多任务、多线程的网页数据采集; 2、支持cookie、post方式; 3、采集数据具备任务临时保存功能,保障数据采集的有效性;临时数据保持为xml文件; 4、采集数据支持导出,可导出Excel及文本文件; 5、采集任务支持文件下载,可采集轻量级文件内容,譬如:图片; 6、采集任务支持数据导航操作,譬如:数据下一页、索引页导航,并根据采集规则对内容页进行数据采集; 7、采集网址的规则可自定义,通过字典表可自定义网址参数,进行数据采集; 8、支持一个任务多个实例的运行,便于用户的选择操作; 9、支持简单的数据加工操作,当前仅支持自动去掉网页内容;


【文件预览】:
TaskClass.xml
dict.xml
Interop.Excel.dll
SoukeyNetget.exe
Tasks
----index.xml(68B)
----生活()
--------index.xml(341B)
--------项目经理招聘信息.xml(4KB)
----Soukey采集()
--------index.xml(68B)
----新闻()
--------index.xml(855B)
--------网易新闻.xml(2KB)
--------新浪新闻 .xml(3KB)
--------和讯财经新闻.xml(4KB)
----车房()
--------index.xml(612B)
--------车型数据.xml(2KB)
--------北京新盘信息(取前10页).xml(3KB)
----Soukey采摘示例()
--------index.xml(597B)
--------~导航下一页示例.xml(4KB)
--------导航下一页示例.xml(2KB)
--------~导航示例.xml(2KB)
--------导航示例.xml(2KB)
----商业()
--------index.xml(591B)
--------软件企业黄页.xml(2KB)
--------~福馨.xml(2KB)
--------福馨.xml(2KB)
----~福馨.xml(2KB)
----Electicified()
--------index.xml(320B)
--------DELL.xml(2KB)
----taskrun.xml(60B)
----hqs()
--------index.xml(319B)
--------~hqs.xml(5KB)
--------hqs.xml(5KB)
----run()
--------Task128901540988364997.xml(977B)
--------Task128901146735834580.xml(977B)
SoukeyConfig.xml
Interop.SHDocVw.dll
MySql.Data.dll
SoukeyNetget.exe.manifest
img
----A08.gif(354B)
----A02.gif(641B)
----folderopen.gif(370B)
----Logo.ico(1KB)
----A04.gif(1004B)
----noti.ico(1KB)
----A01.gif(1KB)
----A07.gif(336B)
----A03.gif(1KB)
----folder.gif(366B)
SoukeyNetget.pdb
readme.txt
Microsoft.mshtml.dll
data
----index.xml(60B)
SoukeyNetget.application

网友评论

  • 挺好用的哈。。。需要注册
  • 挺有用的~~~~
  • 我去这个软件的官网看了,要收费才能使用更多功能
  • 挺好用的哈。。。就是感觉里面注释有点少
  • 版本有点旧了。不能联网。但是还是能够熟悉界面。。。谢谢分享
  • 没用,要注册!!!
  • 需要注册才能使用,你是来搞宣传的吧。。。。