0基础Python实战:爬虫计划---第一课

时间:2021-07-15 20:11:18

网页基本知识

<div>标签,区域框架

    <p>WOW!</p>标签,文字内容

</div>

<li> </li>列表

<img>图片

<h1> </h1> h1-h6不同层标题

<a href = "  ">链接

下载html编辑器,chorme


第二课 

BeautifulSoup解析网页

Soup = BeautifulSoup(html, 'lxml')

点一张图片右键代码,copy Xpath谁在哪第几个 / Selector谁在哪第几个长什么样

绝对路径:/html/body/div[1]/ul/li[1]/img

body > div.main-content > ul > li:nth-child(1) >img