比来在学习爬虫的编写,使用selenium模块时候,遇到了很多坑,本blog的目的是总结一下遇到的坑和解决步伐,以便后来人少走弯路!
以下介绍均以Python3.x为基准进行,基于windows平台的。
我们在做爬虫的时候,制止不了要使用selenium模块,,但是它不是python的标准库,所以需要自行安置。
那么如何安置selenium呢,这时候就用到了pip这个工具。
所谓pip,即Python Install Packet(python安置包)。
2. 然后我们解压下载的pip,打开cmd命令控制台,cd到适才解压的目录:可以看到,python不是内部命令,执行掉败;这是由于python的可执行文件路径没有插手到windows的环境变量里。
3. 设置环境变量:凭据如下的挨次:
计算机 -> 属性 -> 高级系统设置 -> 高级 -> 环境变量 -> path
将python.exe地址路径添加到path中(注意,差别路径间的断绝使用;)
4. 验证pip是否安置告成
使用如下命令(使用此命令之前,同样需要将pip地址的目录插手到环境变量中,默认的pip路径为python.exe同目录文件夹Scripts下):
pip list
5. 安置selenium模块给与如下命令:
pip install selenium
至此,selenium模块算是安置完成了
6. 配置selenium使其撑持差别浏览器开发中,我们一般给与chrome或firefox,因此我以这两款为准进行讲解。
当我们安置完成selenium模块,筹备使用其进行编码时,俄然发明,又有问题呈现了:
产生以上原因是因为: 缺少Chrome/Firefox的webdriver驱动。
驱动的下载地点:
将下载好的驱动解压,然后放到与python.exe同一个目录中;
到此处,你可以尝尝如下代码:
# coding = utf-8 from time import sleep from selenium import webdriver browser = webdriver.Firefox() browser.get(r"http://www.baidu.com") browser.find_element_by_id("kw").send_keys("python") browser.find_element_by_id("su").click() sleep(5) browser.quit()将会打开一个新的firefox窗口,算是selenium配置告成。
2. Pycharm 2017.3破解与使用Pycharm是玩python、web开发、爬虫等等必不成少的工具,其优秀性不必多言,谁用谁知道!
1. 下载并安置 Pycharm2017
安置不用多说了吧!
进入Pycharm, 点击Help -> Register
然后,去下载一个破解软件:
凭据下图进行设置:
输入完成后,点击Active,一切都ok了!
此外,破解的专业网站地点:
3. 注册完成后,我们将开始我们第一个项目: # coding = utf-8 from time import sleep from selenium import webdriver browser = webdriver.Firefox() browser.get(r"http://www.baidu.com") browser.find_element_by_id("kw").send_keys("python") browser.find_element_by_id("su").click() sleep(5) browser.quit()运行过程中,可能会呈现如下的错误:
虽然我们安置了selenium,但是Pycharm找不到这个模块(包),这怎么回事呢?
原因就是我们使用的python 解释器的问题(未使用系统默认的解释器)
可做如下改削:
File -> Settings -> Project coding -> Project interpreter
选择所需要的Python解释器。