文件名称:python爬虫源码
文件大小:11.74MB
文件格式:ZIP
更新时间:2022-05-23 13:57:21
爬虫 百度贴吧 词频统计 python 结巴分词
用python爬取百度贴吧,而后对语料进行处理。利用结巴分词,使用python3,需要自行下载各种库如jieba。而后还有统计词频和关键词提取,功能比较全,但是可能运行起来比较慢。
文件名称:python爬虫源码
文件大小:11.74MB
文件格式:ZIP
更新时间:2022-05-23 13:57:21
爬虫 百度贴吧 词频统计 python 结巴分词
用python爬取百度贴吧,而后对语料进行处理。利用结巴分词,使用python3,需要自行下载各种库如jieba。而后还有统计词频和关键词提取,功能比较全,但是可能运行起来比较慢。