知乎爬虫代码

时间:2020-10-17 15:37:51
【文件属性】:

文件名称:知乎爬虫代码

文件大小:5.23MB

文件格式:BZ2

更新时间:2020-10-17 15:37:51

动态网页爬取 词云 知乎页面 模拟登录

模拟登录,用scrapy+selenium+PhantomJS爬取知乎话题的评论,并且做成关键字词云展示


网友评论

  • 够贵的,实际上代码量不大,之所以体积大是因为混入了一个字体库文件。本身有效代码估计就一百多行。是一个完整的爬虫,是不错的学习资料