python实现验证码识别功能

时间:2022-09-17 09:40:53

本文实例为大家分享了python实现验证码识别的具体代码,供大家参考,具体内容如下

1.通过二值化处理去掉干扰线

2.对黑白图片进行降噪,去掉那些单独的黑色像素点

3.消除边框上附着的黑色像素点

4.识别图像中的文字,去掉空格与'.'

python代码:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
from PIL import Image
from aip import AipOcr
 
file='1-1-7'
 
# 二值化处理,转化为黑白图片
def two_value():
 for i in range(1, 5):
 # 打开文件夹中的图片
 image = Image.open(file+'.jpg')
 # 灰度图
 lim = image.convert('L')
 # 灰度阈值设为165,低于这个值的点全部填白色
 threshold = 165
 table = []
 
 for j in range(256):
  if j < threshold:
  table.append(0)
  else:
  table.append(1)
 
 bim = lim.point(table, '1')
 bim.save(file+'.1.jpg')
 
two_value()
 
# 去除干扰线
im = Image.open(file+'.1.jpg')
# 图像二值化
data = im.getdata()
w, h = im.size
black_point = 0
 
for x in range(1, w - 1):
 for y in range(1, h - 1):
 mid_pixel = data[w * y + x] # *像素点像素值
 if mid_pixel < 50: # 找出上下左右四个方向像素点像素值
  top_pixel = data[w * (y - 1) + x]
  left_pixel = data[w * y + (x - 1)]
  down_pixel = data[w * (y + 1) + x]
  right_pixel = data[w * y + (x + 1)]
 
  # 判断上下左右的黑色像素点总个数
  if top_pixel < 5: #小于5比小于10更精确
  black_point += 1
  if left_pixel < 5:
  black_point += 1
  if down_pixel < 5:
  black_point += 1
  if right_pixel < 5:
  black_point += 1
  if black_point < 1:
  im.putpixel((x, y), 255)
  # print(black_point)
  black_point = 0
 
im.save(file+'.2.jpg')
 
# 去除干扰线
im = Image.open(file+'.2.jpg')
# 图像二值化
data = im.getdata()
w, h = im.size
black_point = 0
 
for x in range(1, w - 1):
 for y in range(1, h - 1):
 if x < 2 or y < 2:
  im.putpixel((x - 1, y - 1), 255)
 if x > w - 3 or y > h - 3:
  im.putpixel((x + 1, y + 1), 255)
 
im.save(file+'.3.jpg')
 
# 定义常量
APP_ID = '11352343'
API_KEY = 'Nd5Z1NkGoLDvHwBnD2bFLpCE'
SECRET_KEY = 'A9FsnnPj1Ys2Gof70SNgYo23hKOIK8Os'
 
# 初始化AipFace对象
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)
 
# 读取图片
filePath=file+'.3.jpg'
def get_file_content(filePath):
 with open(filePath, 'rb') as fp:
 return fp.read()
 
# 定义参数变量
options = {
 'detect_direction': 'true',
 'language_type': 'CHN_ENG',
}
 
# 调用通用文字识别接口
result = aipOcr.basicGeneral(get_file_content(filePath), options)
print(result)
words_result=result['words_result']
for i in range(len(words_result)):
 print(words_result[i]['words'].replace(' ','').replace('.','')) #去掉可能被识别的空格与.

python实现验证码识别功能

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。

原文链接:https://blog.csdn.net/Li_Jiaqian/article/details/80592990