文件名称:tensorflow-captcha-practice:请无用于非法用途,请遵守相关法律法规
文件大小:1.11MB
文件格式:ZIP
更新时间:2024-05-27 00:14:07
Python
用CNN识别验证码的实用教程, tensorflow captcha recognization practical tutorial 本文重在实用,让你半天能搞定验证码的识别,包括从训练材料的获取、预处理和训练,以及predict服务器的搭建。 本文举例的对象(为某银行的微信服务用的,,): 为什么搞爬虫的时候要自己弄验证码识别? 1,省钱,打码的市场价是1分一枚,1万个码就是100块钱,如果一天10万码,那么一个月就要3W。 2,更快更可靠,打码平台经常互相掐架时常DOS,而且一个码要3秒-10秒不等,如果是凌晨时间,就更慢了。如果自己识别了,基本0.1秒识别一枚,能够加快爬虫的速度。 训练材料的获取 到底需要多少标记好的材料? 这和验证码的形态和预处理的方式有关,按本文举例的验证码、采用分割的预处理下,5000个能达到95+。我们实用8000枚的材料,最后能够得到97.5%的正确率。
【文件预览】:
tensorflow-captcha-practice-master
----pre.py(4KB)
----web_server.py(2KB)
----img()
--------cansplit.jpeg(11KB)
--------mnist.png(6KB)
--------3.png(155KB)
--------1.png(150KB)
--------2.png(161KB)
--------cantsplit copy copy.jpg(38KB)
--------cantsplit.jpg(36KB)
--------banner.png(73KB)
--------pre.png(111KB)
--------tensorflow-CNN-share.jpeg(53KB)
--------cantsplit copy.jpg(36KB)
----deyzm.py(8KB)
----sample()
--------x.png(12KB)
--------c.png(12KB)
--------i.png(13KB)
--------4.png(12KB)
--------k.png(12KB)
--------dig()
--------p.png(12KB)
--------12.png(12KB)
--------3.png(12KB)
--------d.png(11KB)
--------m.png(12KB)
--------7.png(12KB)
--------g.png(12KB)
--------5.png(12KB)
--------1.png(13KB)
--------2.png(13KB)
--------h.png(13KB)
--------11.png(12KB)
--------e.png(12KB)
--------a.png(12KB)
--------6.png(12KB)
--------8.png(14KB)
--------0.png(12KB)
--------b.png(8KB)
--------9.png(13KB)
--------10.png(13KB)
--------f.png(12KB)
--------13.png(12KB)
----.gitignore(0B)
----readme.md(7KB)