一、环境准备:
1.浏览器选择:Firefox
2.安装插件:Firebug和FirePath(设置》附加组件》搜索:输入插件名称》下载安装后重启浏览器)
3.安装完成后,页面右上角有个小爬虫图标
4.快速查看xpath插件:XPath Checker这个可下载,也可以不用下载
selenium的webdriver提供了八种基本的元素定位方法,前面六种是通过元素的属性来直接定位的,后面的xpath和css定位更加灵活,需要重点掌握其中一个。
1.通过id定位:find_element_by_id()
2.通过name定位:find_element_by_name()
3.通过class定位:find_element_by_class_name()
4.通过tag定位:find_element_by_tag_name()
5.通过link定位:find_element_by_link_text()
6.通过partial_link定位:find_element_by_partial_link_text()
7.通过xpath定位:find_element_by_xpath()
8.通过css定位:find_element_by_css_selector()
对应的有8种复数定位的方法。
划重点(特殊):
3:class有多个属性的时候,只需要选择其中一个
4:标签定位,一般不用
5:从元素属性可以分析出,有个href = "http://www.hao123.com
例如: driver.find_element_by_link_text("hao123").click()
7:xpath 可以选择用Firefox浏览器插件
此处留给更高深的xpath语法
8:css
此处留给更高深的css语法