【文件属性】:
文件名称:豆瓣热映影评分析词云图生成 python代码
文件大小:10.11MB
文件格式:ZIP
更新时间:2022-06-08 16:32:49
python 软件/插件 词云图生成 豆瓣影评 爬虫
系统环境:python3.8.12 ,编译器: Jupyter notebooks
目录介绍
https://cdn.jsdelivr.net/gh/EverettSy/ImageBed@master/uPic/EKQYvg.png
爬取过程
1. 抓取热映电影的网页内容
2. 爬取评论
3. 清洗数据
4. 使用结巴分词进行中文分词
5. 去掉停用词
6. 统计词频
7. 用词云进行展示
词云图
暗恋·橘生淮南 (2022)
https://cdn.jsdelivr.net/gh/EverettSy/ImageBed@master/uPic/luJwZo.png
豆瓣热映 https://cdn.jsdelivr.net/gh/EverettSy/ImageBed@master/uPic/SBRvJn.png
【文件预览】:
DouBanMovies
----doubanMovie.py(4KB)
----stopwords.txt(3KB)
----.git()
--------index(735B)
--------hooks()
--------config(339B)
--------description(73B)
--------refs()
--------logs()
--------packed-refs(114B)
--------objects()
--------info()
--------HEAD(23B)
----.idea()
--------misc.xml(228B)
--------vcs.xml(180B)
--------modules.xml(276B)
--------DouBanMovies.iml(398B)
--------.gitignore(0B)
----README.md(618B)
----SimHei.ttf(9.6MB)