Python自动化爬取天眼查数据的实现

首先要注册一个账号密码，通过账号密码登录，并且滑块验证，自动输入搜索关键词，进行跳转翻页爬取数据，并保存到Excel文件中。

代码运行时，滑块验证经常不通过，被吃掉，但是发现打包成exe运行没有这个问题，100%成功登录。如果大家知道这个问题麻烦请与我分享，谢谢！

Python自动化爬取天眼查数据的实现

废话不多说直接上代码

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

									# coding=utf-8

									from selenium import webdriver

									import time

									from PIL import Image, ImageGrab

									from io import BytesIO

									from selenium.webdriver.common.action_chains import ActionChains

									import os

									import sys

									import re

									import xlwt

									import urllib

									import datetime

									'''

									用于天眼查自动登录，解决滑块验证问题

									'''

									# 获取项目根目录

									def app_path():

									    if hasattr(sys, 'frozen'):

									        return os.path.dirname(os.path.dirname(os.path.dirname(sys.executable))) #使用pyinstaller打包后的exe目录

									    return os.path.dirname(__file__)

									app_path = app_path()

									ready_list = []

									#设置表格样式

									def set_style(name,height,bold=False):

									    style = xlwt.XFStyle()

									    font = xlwt.Font()

									    font.name = name

									    # font.bold = bold

									    font.color_index = 4

									    font.height = height

									    style.font = font

									    return style

									# 写excel

									f = xlwt.Workbook()

									sheet1 = f.add_sheet('企查查数据',cell_overwrite_ok=True)

									row0 = ["企业名称","法定代表人","注册资本","成立日期","电话","邮箱","地址"]

									for i in range(0, len(row0)):

									    sheet1.write(0, i, row0[i], set_style('Times New Roman', 220, True))

									# 写列

									def write_col(data, row, col):

									    for i in range(0,len(data)):

									        sheet1.write(row,col,data[i],set_style('Times New Roman',220,True))

									        row = row + 1

									def parse_save_data(all_list):

									    row = 1

									    for data in all_list:

									        # 公司名称

									        name_list = re.findall(r'<div class="info">(.*?)</div>',data)

									        print(name_list)

									        # 标签

									        tag_list = re.findall(r'<div class="tag-list">(.*)</div><div class="info row text-ellipsis">', data)

									        tags = []

									        for list in tag_list:

									            tag = re.findall(r'<div class="tag-common -primary -new">(.*?)</div>', list)

									            tags.append(tag)

									        # print(tags)

									        # 法定代表人

									        legal_list = re.findall(r'<a id="codetool">

打包成exe（注意site-packages要换成自己python包的目录）

				?

									pyinstaller main.py -p D:\Anaconda3\Lib\site-packages

最终运行dist目录下的exe

Python自动化爬取天眼查数据的实现

注意事项

由于天眼查没有开会员只能查看到4页内容，所以需要开会员，这个想要绕过就需要另外去研究，毕竟是要充钱付费，破解也没那么简单

到此这篇关于Python自动化爬取天眼查数据的文章就介绍到这了,更多相关Python自动化爬取天眼查数据内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家！

原文链接：https://blog.csdn.net/qq_36767214/article/details/117843296

延伸 · 阅读

精彩推荐

Python

Python中执行存储过程及获取存储过程返回值的方法

这篇文章主要介绍了Python中执行存储过程及获取存储过程返回值的方法,结合实例形式总结分析了Python调用存储过程的常用方法与相关操作注意事项,需要的...

andoring10482020-12-10
Python

详解PyCharm安装MicroPython插件的教程

PyCharm可以说是当今最流行的一款Python IDE了，大部分购买TPYBoard的小伙伴都会使用PyCharm编写MicroPython的程序。这篇文章给大家介绍了PyCharm安装MicroPython插件的...

小五义7482021-07-19
Python

Python列表元素删除和remove()方法详解

这篇文章主要给大家介绍了关于Python列表元素删除和remove()方法的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学...

Hello_xzy_Word8062021-08-21
Python

Python给图像添加噪声具体操作

在本文里我们给大家整理了关于Python如何给图像添加噪声的相关知识点以及操作步骤，需要的朋友们学习下。...

Python教程网12422021-06-04
Python

Python用Pillow(PIL)进行简单的图像操作方法

下面小编就为大家带来一篇Python用Pillow(PIL)进行简单的图像操作方法。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看...

Python教程网10952020-11-24
Python

python生成word合同的实例方法

在本篇内容里小编给大家分享的是一篇关于python生成word合同的实例方法相关内容，有需要的朋友们可以学习下。...

十一11662021-08-24
Python

解决tensorflow测试模型时NotFoundError错误的问题

今天小编就为大家分享一篇解决tensorflow测试模型时NotFoundError错误的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...

John_kai11162021-03-22
Python

总结Python编程中函数的使用要点

这篇文章主要介绍了Python编程中函数的使用要点总结,文中也讲到了人民群众喜闻乐见的lambda表达式的用法,需要的朋友可以参考下...

Flyaway3152020-08-17