【Selenium : 文件操作】

时间:2022-12-20 14:22:42

一、前言

文件操作是 Web 端自动化中比较常用的一个操作,一般文件操作包含:上传、下载

WebDriver 仅仅提供了下载文件相关的 API,上传文件的 API 并没实现,需要我们自己去实现;而且上传文件需要同时兼容 Win 和Mac OSX 两套操作系统

二、普通上传

普通上传是指页面输入框由一个 input 标签组成,最后通过 form 表单将选择的文件路径传给服务器。


【Selenium : 文件操作】

这种方式最简单,只需要使用 WebDriver 定位到输入框元素,然后把文件完整路径设置进去即可。

# 找到元素
element_input = driver.findElement_by_id("element_id")

# 设置文件路径
element_input.send_keys(文件路径)

常见的上传方式是利用 Ajax 或者插件进行上传。

三、 Mac OSX 上传

以下面这个网站选择一张图片上传为例。

【Selenium : 文件操作】

首先,需要安装依赖库:PyUserInput,这个库提供了 API 方便我们模拟键盘操作。

# 安装依赖库
pip install PyUserInput

Selenium 打开目标网站之后,点击上图的按钮,打开选择文件界面。

# 打开网站
self.driver.get("https://www.iloveimg.com/zh-cn/convert-to-jpg/gif-to-jpg")

# 点击上传按钮,打开选择文件界面
self.driver.find_element_by_class_name("uploader__btn").click()

接着模拟执行 MAC 上的快捷键:Command+Shift+G,打开文件路径搜索框

【Selenium : 文件操作】

然后,利用 type_string() 方法将待上传的文件路径设置到输入框内

最后,再模拟按压键盘上的两次 Enter键,即能选中目标文件

# 打开文件路径搜索框
self.keyboard.press_keys(['Command', 'Shift', 'G'])

sleep(2)

# 粘贴到搜索框内
self.keyboard.press_keys(['Command', 'V'])

sleep(2)

# 设置文件路径到输入框内
self.keyboard.type_string(file_path2)

sleep(2)

# 模拟两次Enter键,选择文件
self.keyboard.press_key('Return')

sleep(2)
print('第二次点击Enter')
self.keyboard.press_key('Return')

通过上面的这些操作,即完成了 Mac OSX 上的文件选择操作。

四、 Windows 上传

Win 系统上的文件上传可以使用 AutoIt 这个工具。

AutoIt是 PC 端的一种可以模拟鼠标、键盘操作的类 BASIC 脚本语言,支持 Win 下的标准控件。

对AutoIt不了解的小伙伴可以参考这篇文章:

​自动化篇 | PC 端这款黑科技录制脚本,完爆按 X 精灵!​

和上面的操作步骤类似,我们首先要利用 Selenium 找到按钮元素,指定点击操作,打开选择文件的窗口。

【Selenium : 文件操作】

接着利用 AutoIt 捕获到窗口中的输入框,拿到窗口 Title 及输入框的标识,然后利用 AutoIt Script Editor 编写脚本。

脚本内容分 4 步完成,具体如下:

第 1 步:激活选择文件的窗口

;激活选择文件的窗口
$handle = WinGetHandle("打开","")
WinActivate($handle)


第 2 步:点击输入框,激活输入框


; 点击输入框元素,激活输入框
ControlClick($handle,"","Edit1")

;停顿1秒
Sleep(1000)


第 3 步:设置文件完整路径到输入框内

需要注意的是,由于文件路径是一个变量,可以从传参中读取;其中,第 1 个参数是参数的总个数,第 2 个参数代表文件的完整路径。


;设置文件
;ControlSetText($handle,"","Edit1","C:\Users\Administrator.Win7-2019DMRHYY\Desktop\4866277-6ec08ab76e991bfa.png")

;读取第一个参数
ControlSetText($handle,"","Edit1", $CmdLine[1])


第 4 步,模拟点击打开按钮

【Selenium : 文件操作】

同理,利用 Autoit Window Info 捕获到「 打开按钮 」的元素属性,执行点击操作就能成功选择一个文件


;点击打开按钮
ControlClick($handle,"","Button1")

最后,利用 Aut2Exe 工具将 au3 文件转换为 exe 可执行文件,利用 Python 调用即可以完成整个文件选择操作。


# 预先准备一个文件的完整路径
file_path = 'C:\\Users\\Administrator.Win7-2019DMRHYY\\Desktop\\4866277-6ec08ab76e991bfa.png'

# win下选择文件(使用autoit)
os.system('D:\\python_workspace\\autoit\\upload.exe '+file_path)

五、下载

WebDriver 针对下载功能提供了 API,方便我们对下载文件的配置,包含:下载路径、下载文件路径、是否容许弹窗等,并且主流浏览器的设置方式还存在一些差异。

以指定下载路径为例,说说 Chrome 和 FireFox 浏览器的配置。

Chrome 中的 ChromeOptions 类,可以设置下载的配置文件,最后在 WebDriver 实例化的时候,将这些配置设置进去。

import os

from selenium import webdriver

opt = webdriver.ChromeOptions()

# 下载的配置文件
# 文件下载路径
download_settings = {
'download.default_directory': os.getcwd()
}

opt.add_experimental_option("prefs", download_settings)

# 实例化
webdriver = webdriver.Chrome(chrome_options=opt)

webdriver.get("url")

# 点击一个元素,下载文件
webdriver.find_element_by_id("element_id").click()


如果是 FireFox,使用 FirefoxProfile 实例化一个对象,然后利用 set_preference()设置下载配置文件,最后利用 WebDriver 设置进去。

# 下载路径(全英文)
download_path = '/Users/xingag/Desktop/test'

fp = webdriver.FirefoxProfile()

# 2:下载到指定目录
fp.set_preference("browser.download.folderList", 2)

# 指定下载目录
fp.set_preference("browser.download.dir", download_path)

# binary/octet-stream:表示二进制文件
fp.set_preference("browser.helperApps.neverAsk.saveToDisk", "binary/octet-stream")

# WebDriver 实例化
driver = webdriver.Firefox(firefox_profile=fp)

# 打开一个网站
driver.get("https://pypi.org/project/selenium/#files")

# 下载文件
driver.find_element_by_id("element_id").click()