文件名称:cz1016_kdrama
文件大小:87.21MB
文件格式:ZIP
更新时间:2024-05-12 07:33:05
JupyterNotebook
CZ1016 Kdrama化学匹配器 完成者:陈星宇,Jacintha Wee,Valencia Lie 1.刮 1.1。 kdrama.py:蜘蛛,用于抓取所有电视剧的网址 1.2。 basic_cleaning.ipynb:从上方的蜘蛛刮下的csv的基本清洁 1.3。 actor_info.py:抓取一般信息的蜘蛛 1.4。 cleaning.ipynb:从actor_info.py刮取的csv的基本清洁 1.5。 ind_re.py:抓取kdrama评论的蜘蛛 2. EDA 2.1。 EDA.ipynb:Jupyter笔记本,其中包含有关一般信息和评论的EDA 3.审查分析 前处理 3.1。 kdrama.ipynb:计算每部戏剧的评论数,并删除评论不足的评论 3.2。 coref.ipynb:删除非英语评论,转换表情符号/表情符号,替换代词(requirements_coref.