Python:第三方模块BeautifulSoup的安装及简单用法

时间:2021-12-14 21:46:43

BeautifulSoup简介

  BeautifulSoup是python的一个第三方库,在爬虫中,起着网页解析器的作用,可以对下载好的网页进行页面元素分析,提取出有价值的数据,相比较Lxml,BeautifulSoup的性能会差一些,毕竟是纯python,但是BeautifulSoup解析网页的支持度貌似会好一些。

安装

附上bs4官网(https://www.crummy.com/software/BeautifulSoup/)

  windows

 首先进入pip的安装目录,位于Scripts文件夹中

 Python:第三方模块BeautifulSoup的安装及简单用法

 然后执行pip install beautifulsoup4
  Python:第三方模块BeautifulSoup的安装及简单用法
  等待安装完成
    Linux
$ sudo apt-get python-bs4(python2)
$ sudo apt-get python3-bs4(python3)
  等待安装完成
简单用法
举个例子
Python:第三方模块BeautifulSoup的安装及简单用法

可以通过find_all()方法
找到相关区域,然后通过get_text()访问标签下面的内容,也可以读取href属性中的内容

Python:第三方模块BeautifulSoup的安装及简单用法

更多的方法使用在官方说明文档上都有,官网上也有示例
小白发帖,欢迎批评指正!!