Python+Selenium+Chrome 的一个案例

时间:2022-11-16 03:59:56

第一步,下载chromeDrive:http://npm.taobao.org/mirrors/chromedriver(我下载的是2.43版本的chromedriver_win32.zip)

下载之后,把chromedriver.exe 解压到安装JetBrains PyCharm 2018.2.4 x64的路径下。

第二步,在JetBrains PyCharm 2018.2.4 x64 工具中下载selenium库,具体如何下载,请看我的博客"JetBrains PyCharm 2018.2.4 x64 工具里如何安装bs4"。

第三步:自动打开chrome浏览器

from selenium import webdriver
from selenium.webdriver.common.keys import Keys dest = r"F:\python\chromedriver.exe" #chromedriver本地保存的路径
'''
实例化webdriver时,可以通过参数对浏览器做些设置,如设置网络代理、浏览器下载文件保存路径等。若是不传参数,则默认继承本地浏览器设置,
若是对浏览器启动时属性进行设置,则就利用到了ChromeOption类。具体信息可参考chromedriver官网。“Python+Selenium+第三方浏览器”可以处理多种爬虫场景,
包括静态页面,post表单,以及JS等。应用场景很强大,使用selenium操作浏览器进行模拟点击的方式就可以让我们省心很多,不需要担心有什么“隐藏字段”、cookie追踪等。
但对于包含验证码网页的操作,这种方式也不好处理,主要困难在于图像识别。若是页面包含验证码,那就需要结合图像识别工具了,
这种情况相对也比较难处理,图像识别准确率受到图片内容影响。
'''
def init_webdriver(proxy=False):
''' 设置浏览器默认下载路径 '''
PROXY ="x.x.x.x;8080"
options =webdriver.ChromeOptions()
options.add_experimental_option("prefs", { "download.default.directory": r"F:\python\download", "safebrowsing.enabled":True })
if proxy:
options.add_argument('--proxy-seerver=%s'% PROXY)
driver = webdriver.Chrome(executable_path=dest, chrome_options=options)
return driver if __name__ == "__main__":
browser_driver =init_webdriver(True)
browser_driver.get("https://connect.microsoft.com/site1304/Downloads")
print ("客户端会完成重定向,跳转到登录界面") if "login." in browser_driver.current_url:
print("获取登录框元素")
elem = browser_driver.find_element_by_name("loginfmt")
print("清空登录框内容")
elem.clear()
print("在账户框中输出账号,并回车,完成页面跳转")
elem.send_keys("current_key:"+Keys.RETURN)