文件名称:豆瓣热映影评分析词云图生成 python代码
文件大小:10.11MB
文件格式:ZIP
更新时间:2022-06-08 16:32:49
python 软件/插件 词云图生成 豆瓣影评 爬虫
系统环境:python3.8.12 ,编译器: Jupyter notebooks 目录介绍 https://cdn.jsdelivr.net/gh/EverettSy/ImageBed@master/uPic/EKQYvg.png 爬取过程 1. 抓取热映电影的网页内容 2. 爬取评论 3. 清洗数据 4. 使用结巴分词进行中文分词 5. 去掉停用词 6. 统计词频 7. 用词云进行展示 词云图 暗恋·橘生淮南 (2022) https://cdn.jsdelivr.net/gh/EverettSy/ImageBed@master/uPic/luJwZo.png 豆瓣热映 https://cdn.jsdelivr.net/gh/EverettSy/ImageBed@master/uPic/SBRvJn.png
【文件预览】:
DouBanMovies
----doubanMovie.py(4KB)
----stopwords.txt(3KB)
----.git()
--------index(735B)
--------hooks()
--------config(339B)
--------description(73B)
--------refs()
--------logs()
--------packed-refs(114B)
--------objects()
--------info()
--------HEAD(23B)
----.idea()
--------misc.xml(228B)
--------vcs.xml(180B)
--------modules.xml(276B)
--------DouBanMovies.iml(398B)
--------.gitignore(0B)
----README.md(618B)
----SimHei.ttf(9.6MB)