python爬虫源码

时间:2022-05-23 13:57:21
【文件属性】:

文件名称:python爬虫源码

文件大小:11.74MB

文件格式:ZIP

更新时间:2022-05-23 13:57:21

爬虫 百度贴吧 词频统计 python 结巴分词

用python爬取百度贴吧,而后对语料进行处理。利用结巴分词,使用python3,需要自行下载各种库如jieba。而后还有统计词频和关键词提取,功能比较全,但是可能运行起来比较慢。


网友评论