前言

我们在做WEB自动化时，最根本的就是操作页面上的各种元素，而操作的基础便是元素的定位，只有准确地定位到唯一元素才能进行后续的自动化控制，下面将对各种元素定位方式进行总结归纳。

说明：以下操作统一使用百度首页<www.baidu.com>进行示例，鼠标右键然后点击检查（或按f12）可以查看具体的前端代码。

单一属性定位

6种单一属性定位： id，name，class name，tag name，link，partial_link

2种多样式定位：css、xpath(强烈推荐)

通过元素的id

# 通过id(id唯一)
ele = driver.find_element_by_id("kw")    # 类 WebElement - 属性、方法
print(ele.get_attribute(\'class\'))   # 获取该id的class属性值
ele.send_keys("selenium")   # 发送内容

在前端页面中，id是指页面匀速的的属性名id值，元素的id值在当前整个HTML页面中是唯一的，因此可以通过id属性来唯一定位一个元素，是首选的元素定位方式，但不是每个元素都有id属性。此外，也有动态变化的id值，即每次进入页面该元素的id值都不一样，一般是由一串英文+数字组成的字符串，这种情况下就不要使用id去定位元素了(因为下一次很有可能就找不到它了)。

通过元素的name

# 通过name
driver.find_element_by_name("wd")   # 不一定唯一  # elements

元素的name属性，但name不一定是唯一的，就像大家的身份证号是唯一的，但是名字会有重复。driver.find_element_by_name只返回第一个匹配到的元素，如果想返回所有匹配到该name的元素，则使用driver.find_elements_by_name，区别就是element带不带s。这里特别说明一下，find_elements不管找到多少个，都会返回一个list(找不到则返回空列表)，列表当中的每一个元素就是一个 WebElement。

通过元素的class

# 通过class_name
driver.find_element_by_class_name(\'mnav c-font-normal c-color-t\')   # 不一定唯一，只返回匹配到的第一个元素
driver.find_elements_by_class_name(\'mnav c-font-normal c-color-t\')	# 返回元素列表，按照dom树从上往下

元素的class属性，在前端，class一般是用来元素进行分组的，并对这一级元素设置相同的样式，因此会存在多个元素会共用一个class，不一定是唯一值。与name一样，element带s时返回匹配到的元素列表。

通过元素的标签名

# 通过tag_name
driver.find_element_by_tag_name(\'span\')   # 不唯一   # elements

tag就是元素的标签标识，不一定是唯一值，element带s时返回匹配到的元素列表。

通过元素的超链接文本

# 通过link_text
driver.find_element_by_link_text(\'hao123\')	   # 不是唯一   # elements

精确匹配链接的文本值，不一定是唯一值，element带s时返回匹配到的元素列表。

通过元素的部分超链接文本

# 通过partial_link_text
driver.find_element_by_partial_link_text(\'hao\')	   # 不是唯一   # elements

模糊匹配链接的文本值，element带s时返回匹配到的元素列表。

XPTH定位

以上介绍的6中定位方式，都是针对元素的单一特征来定位元素，但在实际应用中，一般都需要组合以上各种情况来定位一个元素。那么xpath和css定位就可以实现各种组合，基本可以覆盖所有的元素定位。

xpath是一门在xml文档中查找信息的语言，因为html与xml比较相似，用得比较广泛，所以xpath也可以用于在html对元素进行定位。它是将整个html看成一个树形结构，html为根节点，页面当中节点与其他节点可以有祖先、父辈、兄弟、这样的关系，类似一个族谱。

selenium提供的xpath定位的方法名：find_element_by_xpath(xpath表达式)，表达式语法如下：

表达式	说明
/	绝对定位，从根节点选取
//	相对定位，选择匹配的节点
.	选择当前节点
..	选择当前节点的父节点
@	选择属性，如：@class="class值"，@id="id值"，属性放在中括号[]中
*	通配符，匹配所有
@*	通配符，匹配所有属性，如：@*="test"

绝对定位(不建议) : /单斜杠开头，严格按照层级、同级元素的位置，只要位置改变就无法定位，如：/html/body/div[2]/[form]/div[1]/input
相对定位：//双斜杠开头，在参照物之下只要符合条件的元素存在即可，表达式://标签名[@属性名=值] ，用*表示要匹配所有标签，如：//*[@id="kw"] 匹配所有标签
下标定位(不建议)：路径下相同标签的下标，如：//*[@id="th"]/a[2]，意思是该路径下第二个a标签
逻辑运算：表达式中可以使用and 、or 描述元素的多个属性，表达式://标签名[@属性名=值 and @属性名=值]
层级定位：靠本身特性无法唯一定位的时候，使用层级去定位，如：//div[@id="u1"]//a[@name="tj_login"]。/(单斜杠)表示在前一个元素的直系下， //(双斜杠)表示在前个元素之下的所有范围内
文本定位：通过标签内的文本内容，表达式： //标签名[text()="文本"]
包含(部分属性)：标签的部分属性，表达式：//标签名[contains(@属性名 , "部分属性值")] ，如： //a[contains(@href,"Cource/homework")]，部分文本也可以，//a[contains(text(), "部分文本")]
轴定位：一般用于表格样式的数据列，需要通过组合来进行定位，轴运算名称为以下6种，使用语法：/轴名称::节点名称[@属性=值]，例： //div//table//td/preceding::td，只要后面接的是轴定位要用/(单斜杠)。

秒客网

【python+selenium的web自动化】- 8种元素定位方式详解

前言