autoIT 自动化上传/下载文件图文详解【python selenium】

时间:2023-01-21 17:38:48

情景:

在用selenium进行web页面自动化时,时不时会遇到上传附件的情况,常见的情况就是一个上传按钮,点击后弹出windows窗口,选择文件后上传,如下图1所示

autoIT 自动化上传/下载文件图文详解【python selenium】

图1

这种情况超出了selenium的能力范围,需要借助其他工具来实现,这里介绍AutoIt这个工具:

1.下载并安装

进入AutoIt官网,选择AutoIt -> Downloads,如图2:

autoIT 自动化上传/下载文件图文详解【python selenium】

图2

然后选择Full Installation版本,里面包含了所需的所有工具,如图3:

autoIT 自动化上传/下载文件图文详解【python selenium】

图3

下载后直接安装即可。

2.探测控件

  (1).首先从“开始”菜单里找到"Au3Info_x64.exe" 打开,如图4:

autoIT 自动化上传/下载文件图文详解【python selenium】

图4

  (2).打开需要上传的页面,点击上传,弹出上传窗口,如上面图1所示

  (3).在AutoIt上面,用鼠标按住Finder Tool不放(鼠标图标变成一个*的样子),移动到上传窗口的文本输入框中,然后松开,如图5

autoIT 自动化上传/下载文件图文详解【python selenium】

图5

松开后查看探测结果,如图6:

autoIT 自动化上传/下载文件图文详解【python selenium】

图6

主要关注图6中红色标注的信息:

          窗口标题,即Title,图中是“文件上传”

          窗口的class,图中是32770

          控件的类型以及编号,图中类型是Edit,编号(Instance)是1,表明是窗口中第一个文本输入框

类似地,重复上面的一步,获取“打开”按钮的信息,图如7:

autoIT 自动化上传/下载文件图文详解【python selenium】

图7

由于是同一个窗口,因此标题和class都和上面的一样,不同的是,这里的"打开"按钮的类型是Button,编号为1(如果是“取消”按钮,编号就是2)。获取到这些必须信息后,就可以开始编写脚本了。

3.编写脚本

从开始菜单中打开SciTE Script Editor,编写如图8的内容:

autoIT 自动化上传/下载文件图文详解【python selenium】

图8

脚本内容如下,分号开头的是注释:

  ; 等待5秒钟,让上传窗口出现
  WinWait("[CLASS:#32770]","",5)

  ;把输入焦点定位到上传输入文本框中,类型为Edit,编号为1,也就是上面获取到内容
  ControlFocus("文件上传", "","Edit1")

  ;在文件名那里,输入需要上传的文件绝对路径

  ControlSetText("文件上传", "", "Edit1", 'D:\files\file_name')

  ;等待上传时间,单位是毫秒 1秒 = 1000 毫秒,文件大的话需要设置长点
  Sleep(5000)

  ;点击"打开"按钮,也就是上传,完成整个上传过程
  ControlClick("文件上传", "","Button1");

保存为.au3脚本,然后在浏览器中点击上传,使上传窗口出现,如图1所示,然后在SciTe Scripts Editor里面选Tools -> Go (或直接按F5) 即可看到自动上传效果。

4.转换为exe文件

在开始菜单中打开"Compile sctrip to .exe x64"(32位的机器选x86),然后选择要装换的.au3文件和输出的exe文件路径和名称,最后点击下面的"Convert"即可,如图9:

autoIT 自动化上传/下载文件图文详解【python selenium】

图9

5.使用python调用

使用配Python调用是,首先用python控制selenium,打开上传窗口(图1),然后用

    import os

    os.system(r'C:\Users\dell\Desktop\no_argument.exe')  #这里是保存的exe文件,根据自己的实际情况修改

然后跑python脚本,即可完成文件上传。

6.参数化

上面的过程虽然可以上传文件,但是路径、文件名都是写死在脚本里面的,如果要上传其它路径、其它文件,就要要重新修改脚本,编译成exe文件;如果上传多个文件,每个文件都要写个脚本然后转成exe

那岂不是很蛋疼? 参数化可以解决这个问题。

控件探测过程还和原来一样,脚本参数化只需要修改脚本,如图10:

autoIT 自动化上传/下载文件图文详解【python selenium】

图10

脚本内容如下,注意黄色背景的内容:

; 等待5秒钟,让上传窗口出现
WinWait("[CLASS:#32770]","",5)

;把输入焦点定位到上传输入文本框中
ControlFocus("文件上传", "","Edit1")

;判断是否有参数
IF $CmdLine[0] > 0 Then ;有参数
  $file = $CmdLine[1]
;Else ;无参数,传递默认的文件
  ;$file = 'D:\work\1.png'
EndIf

;在文件名那里,使用参数
ControlSetText("文件上传", "", "Edit1", $file)

;等待上传时间,单位是毫秒 1秒 = 1000 毫秒
Sleep(5000)

;点击"打开"按钮,也就是上传
ControlClick("文件上传", "","Button1");

同样保存为.au3文件,然后打开上传窗口,按F5运行,成功后转换为exe文件

注意:

参数化之后,调用时需要传递参数,再用os.system(r'C:\Users\dell\Desktop\upload.exe  参数') 这种绝对路径调用,并不能生效,解决办法是把生成的exe文件,放到PATH里面,然后不带路径,直接调用

os.system('upload.exe upload_filename') 即可(过程中会有命令提示符窗口一闪而过,请无视)。

举一反三:如果连窗口id,文本输入框都变化,该怎么办?如果上传的文件比较到,需要等待较长时间怎么办?

提示:控件标识,比如类型、编号,等待时间,都可以参数化。下提供一个大体上通用(不敢说所有情况都适用)的脚本以及调用函数:

7.进一步参数化

把上面参数化的脚本修改为如图11的内容:

autoIT 自动化上传/下载文件图文详解【python selenium】

图11

其中第3~8行,分别对应的是:

windowTitle是上传窗口的标题,对应图6上面的Title,“文件上传” (这个跟浏览器有关,firefox可能叫做“上传文件”,chrome则可能是“打开”)

windowID是上传窗口的标识ID,对应图6上面的class,"#32770"  (这个ID好像基本都是一样的,不过不是很肯定)

windowText是上传窗口的文本输入框,对应图6上面的class和instance,这里把他们合并到一起了

windowButton是上传窗口的“打开”按钮,这里把class和instance也合并到一起

uploadTime就是上传时等待的时间,如果上传的文件比较大或者网速比较慢,这个时间需要设置长一点,单位是秒

把这个脚本转换为exe文件,比如upload_file.exe,然后放入PATH中,

使用下面代码调用:

    os.system('%s "%s" "%s" "%s" "%s" %d %s' % ('upload_file.exe','文件上传','32770','Edit1','Button1',2,r'D:\testfile\thefile'))

#注意上面这个写法中,除了uploadTime需要传递为整数之外,其他参数都要传递为字符串

下面提供一个现成的函数,有兴趣的话可以试试:

autoIT 自动化上传/下载文件图文详解【python selenium】

(别问我为什么只贴图不贴内容。 纸上得来终觉浅,绝知此事要躬行。手动敲一遍比看十遍学得都快!怎么样 autoIT 自动化上传/下载文件图文详解【python selenium】

说明:

第一个参数dirver是浏览器对象,第二个就是我们刚编译成的exe文件,第三个是要上传的文件所在的目录,第四个是要上传的文件,如果有多个,需要放在列表中,比如['file1','file2']

考虑到windows上大部分上传窗口都是一样的,后面几个采用了默认参数

需要注意的是,第17、18行获取上传按钮并点击,需要修改成具体的情况,而且上传一个文件后,之前获取到的upload_button这个元素句柄失效,必须重新用find_element获取一次

下面是调用的示例(ff是生成的浏览器对象,我用是firefox,叫做ff):

upload_files(ff,'upload_file.exe',r'D:\Work\测试图片','php.jpg')   #上传单个文件
upload_files(ff,'upload_file.exe',r'D:\Work\测试图片','redhat.jpg')
upload_files(ff,'upload_file.exe',r'D:\Work\测试图片',['redhat.jpg','ubuntu.jpg','php.jpg','linux.png'])   #上传多个文件
upload_files(ff,'upload_file.exe',r'D:\tmp','data.zip',uploadTime=30)    #zip文件比较大,设置上传时间为30秒
upload_files(ff,'upload_file.exe',r'D:\tmp',['Git使用.docx','debian.jpg','vim.jpg'],uploadTime=1)  #jpg文件比较小,设置上传时间1秒

当然,如果你的上传窗口跟这个完全不同,最完整的情况就是:

upload_files(ff,'upload_file.exe',r'D:\tmp',['Git使用.docx','debian.jpg','vim.jpg'],windowTitle="打开",windowID="12345",windowText="Edit100",windowButton="Btn100",uploadTime=1)  #jpg文件比较小,设置上传时间1秒

不过你要是提供了所有的参数,大可以这样:

upload_files(ff,'upload_file.exe',r'D:\tmp',['Git使用.docx','debian.jpg','vim.jpg'],"打开","12345","Edit100","Btn100",1)

如果不知道为什么的话,补补Python去吧。

至于下载,过程和上传相反,稍后补充。