文件名称:HollyBolly:宝莱坞戏剧之谜-数据分析项目
文件大小:9.66MB
文件格式:ZIP
更新时间:2024-04-26 10:57:24
Python
HollyBolly-宝莱坞戏剧之谜数据分析项目 介绍 我们是爱电影的两个人Maayan Magenheim和Jehonathan Spigelman,印第安人,媚俗和愚蠢的人,不一定按这个顺序。 与好莱坞相反,印度电影业或多或少地提供一种独特的文化,这激起了我们的兴趣,并提出了一些有趣的问题,包括媚俗的产生方式,创造方式是内容还是形式。 该项目是在耶路撒冷大希伯来大学互联网与社会系“大数据分析”课程的一部分下创建的,并由Dafna Shahaf教授指导。 项目结构 该项目包括两个里程碑,每个里程碑使用不同的数据以及不同类型的检查和分析。 在里程碑1中,我们正在处理情节摘要,并试图找到它们之间的差异。 在里程碑2中,我们分析了数十亿部好莱坞和宝莱坞电影的字幕,并借助情感分析工具包,试图测试宝莱坞的某些戏剧性效果是否是通过戏剧性的文字和多次沉默而产生的(请参见下文)。 里程碑#1 我们使用
【文件预览】:
HollyBolly-main
----Milestone 2()
--------BollyHolly Silence Peaks.xlsx(4.74MB)
--------count_list_creator.py(2KB)
--------bolly_holly_main.py(3KB)
--------BollyHolly Rank Peaks.xlsx(5.2MB)
--------subtitles_parser.py(9KB)
--------silence_calculator.py(4KB)
----Milestone 1()
--------Bollywood Plot Summary.csv(3.57MB)
--------HolywoodData.py(2KB)
--------BollywoodData.py(2KB)
--------Hollywood Plot Summary.csv(5.19MB)
----README.md(5KB)