BeautifulSoup的选择器

时间:2022-03-04 01:37:28

用BeautifulSoup查找指定标签(元素)的时候,有几种方法:

soup=BeautifulSoup(html)

1.soup.find_all(tagName),返回一个指定Tag元素的列表

2.soup.select(selector),返回一个指定Tag元素的列表,是非常好用的方法,它支持大部分css选择器(可在链接页面内查找"CSS选择器"相关章节),如类选择器,id选择器,子代选择器(但不支持直接子代选择器)

例如可以这样写,soup.select('.listConent div ul li'),表示要查找class='listContent'的某个标签下的div标签的ul标签下的所有li元素。

如果你想查找class='listContent'的某个标签下的直接子代div标签,soup.select('.listConent > div'),而jquery写成$('.listConent > div')

3.你可以逐层访问Tag的子标签[链接,可在链接页面内查找".contents 和 .children"章节],如 x.div.next_sibling.div.p.a.string

参考:

http://blog.csdn.net/fangwc/article/details/51192057