文件名称:BigDataProject:大数据最终项目
文件大小:2.8MB
文件格式:ZIP
更新时间:2024-07-27 16:39:47
Python
#看看纽约市出租车数据以及我们如何小费 使用大数据集进行计算 - 纽约大学 Courant 研究所 - 2014 年秋季 项目作者: 林,艾米丽 刘,托马斯 肖·苏珊托,比利 主要工具 Python(主要语言) iPython Notebook(主平台) GeoPy(用于反向地理编码) 熊猫(用于数据分析) Tableau(用于数据可视化) 数据 该项目使用数据,他向纽约市出租车和豪华轿车委员会索取了 2013 年纽约市的所有出租车乘车数据。 祝福他的心。 我们获取了所有旅行信息,以及所有票价。 我们抽样了大约 7500 万次乘车 (>= 30GB) 以进行以下分析。 数据分析 基本信息(每点 1 张幻灯片) 哪个街区乘坐出租车最多(接送):1) 前 10 名列表 2) 饼图 - “top neighbor.csv” 哪个是最受欢迎的出租车社区(下车) 1) 前 10 名
【文件预览】:
BigDataProject-master
----presentation()
--------3.png(218KB)
--------2.jpg(86KB)
--------1.jpg(15KB)
--------bigdatapres.pptx(749KB)
----geolocator()
--------.ipynb_checkpoints()
--------geolocator_data.csv(11KB)
--------Data 1.ipynb(86KB)
--------NYC Taxi Data.ipynb(797KB)
--------Final()
--------preprocess_geopy.py(2KB)
--------geolocator_creater.py(2KB)
--------Data 1()
--------preprocess_offline.py(2KB)
----viz()
--------geolocator_data.csv(8KB)
--------avg_speed_per_hour.csv(358B)
--------payment_type_time.xlsx(15KB)
--------new_trip_data_1_5.csv(3.82MB)
--------avg_farep_1000k.csv(389B)
--------datavis.twb(402KB)
--------avg_farep_10k.csv(2KB)
--------top_drop_neighborhood.csv(737B)
--------payment_type_neighborhood.csv(24KB)
--------tip_by_distance.csv(446B)
--------avg_farep_100k.csv(1KB)
--------top_pick_neighborhood.csv(732B)
--------avg_tip_neighborhood.csv(6KB)
--------avg_farep_neighborhood.csv(6KB)
--------avg_tip_by_hour.csv(359B)
--------payment_type_time.csv(370B)
--------count_by_pickup_hour.csv(362B)
----README.md(2KB)
----.gitignore(103B)