这是一个最简单的图像识别,将图片加载后直接利用Python的一个识别引擎进行识别
将图片中的数字通过 pytesseract.image_to_string(image)识别后将结果存入到本地的txt文件中
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
#-*-encoding:utf-8-*-
import pytesseract
from PIL import Image
class GetImageDate( object ):
def m( self ):
image = Image. open (u "C:\\a.png" )
text = pytesseract.image_to_string(image)
return text
def SaveResultToDocument( self ):
text = self .m()
f = open (u "C:\\Verification.txt" , "w" )
print text
f.write( str (text))
f.close()
g = GetImageDate()
g.SaveResultToDocument()
|
具体想要实现上面的代码需要安装两个包和一个引擎
在安装之前需要先安装好Python,pip并配置好环境变量
所有包的安装都是通过pip来安装的,需要在windows PowerShell中进行,并且是在 C:\Python27\Scripts目录下
1.第一个包: pytesseract
1
|
pip install pytesseract
|
若是出现安装错误的情况,安装不了的时候,可以将命令改为 pip.exe install pytesseract来安装
若是将pip修改为pip.exe安装成功后,那么下文的所有pip都需要改为pip.exe
2.第二个包:PIL安装
1
|
pip install PIL
|
若是失败了可以如下修改 pip install PILLOW
3.安装识别引擎tesseract-ocr
下载 tesseract-ocr,进行默认安装
安装完成后需要配置环境变量,在系统变量path后增加 tesseract-ocr的安装地址C:\Program Files (x86)\Tesseract-OCR;
一切都安装完成后运行上述代码,会发现报错,此时需要
至此结束。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:http://blog.csdn.net/Goldxwang/article/details/74719348