知乎爬虫代码

时间:2020-10-17 15:37:51
【文件属性】:
文件名称:知乎爬虫代码
文件大小:5.23MB
文件格式:BZ2
更新时间:2020-10-17 15:37:51
动态网页爬取 词云 知乎页面 模拟登录 模拟登录,用scrapy+selenium+PhantomJS爬取知乎话题的评论,并且做成关键字词云展示

网友评论

  • 够贵的,实际上代码量不大,之所以体积大是因为混入了一个字体库文件。本身有效代码估计就一百多行。是一个完整的爬虫,是不错的学习资料