抓图神器2016 with update 3

时间:2019-03-14 06:44:20
【文件属性】:

文件名称:抓图神器2016 with update 3

文件大小:1.78MB

文件格式:ZIP

更新时间:2019-03-14 06:44:20

网页抓图 链接提取 C# .NET 正则表达式

Important updates in update 3: 1. 修复了图片地址末尾有空白符时下载不到图片的bug。 2. 除常见的.jpg,.jpeg和.png外,添加了.bmp,.gif格式的图片下载支持。 3. 修正了下载时间<1秒时,用时显示不正确的问题。 4. 普通窗体添加了按页码抓图的功能,此功能有效解决了某些帖子分页过多,中间的分页在给定的网址中无链接而下载不到图片的问题。 如需下载某帖子第N页到第M页中的所有图片,网址形如:网址前半部分+页码+网址末尾部分,勾选页码后,在第一行的4个文本框中依次输入网址前半部分、网址末尾部分、N、M。 勾选页码后,分页正则表达式不再可用。取消勾选页码后,即按以前的模式操作,网址一栏需输入完整的网址,若要抓取该网页中的某些链接所指向的页面中的图片,需设置正则表达式。 Important updates in update 2: 1. 不再通过判断Windows操作系统版本开启透明或普通窗体;启动时将首先出现一个选择界面,由用户自行选择使用透明还是非透明窗体。 2. 普通窗体和关闭按钮弹出对话框新增背景图。 3. 添加天涯论坛防盗链图片下载支持。 Important updates in update 1: 新增选项,可智能抓取百度贴吧帖子中的图片对应的高质量原图。 Features: 1. 从指定网页以及符合所设定的正则表达式匹配规则的二级页面中,下载所有图片到指定目录, 一张图下载完成后会执行检查,自动删除头像之类的小图。 图片以该图在网页源码中的名字命名,若指定目录中已存在同名文件,则自动在后面加上“(1)”,若还存在则加“(2)”...以此类推。 一次下载任务中,若同一图片出现多次(以完整的uri地址为准),只下载一次。 默认保存位置为用户图片目录下的SavedPics目录,若该目录不存在,点击提取图片后开始下载前,会自动创建;用户也可自行选择保存位置。 自动计时,图片下载完成后,显示所用时间。 2. 从指定网页中提取所有链接,保存到由用户命名的文件中,若不加后缀,自动以.html结尾。 UI Design: 1. 智能判断当前Windows系统版本,若是Windows7(NT6.1), 则开启透明特效窗体,其他版本的Windows则调用普通非透明窗体。 2. 主界面进度条和任务栏动态显示下载进度(抓取图片时),根据下载任务状态(如下载失败,下载完成,取消等),任务栏图标上的颜色随之变化,同时弹出提示对话框。 若已最小化到托盘,以右下角气泡通知的形式提示下载任务出现的状况。 3. 点击关闭按钮时,默认会弹出询问关闭按钮执行什么操作的对话框,勾选不再提示后,以后不再显示此对话框,若要恢复,点击托盘图标右键菜单的“重置所有设置”即可。 4. 双击托盘图标可显示或隐藏主窗体。 Requirements: 1. Recent Windows operating systems such as win7, win8, win10, etc, are all OK. Not yet tested on earlier Windows platforms. 2. .NET Framework 4.5 or above is installed. Note: 1. 为保证程序正常运行,请勿删除或更改本程序目录下的任何文件. 2. 程序主界面上,Encoding是指网页的编码,可通过网页源码查看其charset, 提取链接时需要选择相应的编码,所保存的文件中才能正常显示链接网页的title;提取图片可不选编码。 3. 程序只提取指定网页中的链接,不会继续去该网页中的链接所指向的网页(二级页面)中去提取链接,所以提取链接时,分页正则表达式不用管。 提取图片时,若要提取二级页面中的图片,如百度贴吧一个帖子中各个分页中的所有图片,需要选择或者手动输入正确的正则表达式。 该正则表达式用来匹配二级页面的链接末尾,从而找到用户想要从中提取图片的那些页面。 例如百度贴吧的帖子各分页链接以“?pn=数字”结尾,所以正则表达式选择“\?pn=\d+$”;有些网站分页链接以“_数字.html”或者“_数字”结尾,正则表达式为“_\d+(\.html)?$”; 还有以“数字.html”结尾的,正则表达式为“\d+(\.html)$”。 下拉列表只列出了几种常见的,若需要从中提取图片的分页的链接末尾不符合其中任何一种正则表达式,用户可自行手动输入。 如果不从二级页面中提取图片,只提取指定网页中的图片,分页正则表达式一栏不填或者选择none. 4. 本程序仅支持源码中有图片地址的网页图片抓取。一些采用高级技术的网页,图片地址在源码中不可见,暂不支持这类网站的图片抓取。 Unfixed Bugs: 1. 下载中点取消,会卡一阵,这是由于正在终止下载线程,网速不好时或者网站服务器响应慢,容易出现此现象。 2. 正在下载时或者下载完成后退出程序,有一定几率出现“抓图神器.exe已停止工作”,点关闭程序就好了。 3. Win7下程序会调用透明窗体运行,但是尚未实现label文字背景透明,将窗体置于浅色背景之上,文字有点模糊不清,建议将其放在深色背景上面操作。


【文件预览】:
抓图神器2016.3
----Microsoft.WindowsAPICodePack.dll(89KB)
----Readme.txt(4KB)
----Microsoft.WindowsAPICodePack.Shell.dll(518KB)
----抓图神器.exe(2.18MB)
----抓图神器.exe.config(191B)

网友评论