今天用xpath提取的网页的文本出现 ,类似于空格,空行这样,提取文本打印出现如下情况:
很是难受,本来自己对于爬虫就是新手小白,然后转念一想,BS4是一个强大的解析库,所以就试了一下,结果2行代码搞定上述问题,解决办法如下图:
这样打印出来就舒服很多了。O(∩_∩)O
相关文章
- python爬虫+网页点击事件+selenium模拟浏览器,爬取选股宝内容
- windows下使用python的scrapy爬虫框架,爬取个人博客文章内容信息
- python爬取糗百内容
- python爬虫实战(六)--------新浪微博(爬取微博帐号所发内容,不爬取历史内容)
- [Python 爬虫之路3] 使用seletom,爬取淘女郎-美人库的内容
- 看我怎么扒掉CSDN首页的底裤(python selenium+phantomjs爬取CSDN首页内容)
- python 爬取网页内容
- 用url传值中文乱码的问题(爬取网页内容的时候)
- python中requests爬去网页内容出现乱码问题解决方法介绍
- python3 [爬虫入门实战] 爬虫之使用selenium 爬取百度招聘内容并存mongodb