【文件属性】:
文件名称:BigDataProject:大数据最终项目
文件大小:2.8MB
文件格式:ZIP
更新时间:2021-07-07 22:53:07
Python
#看看纽约市出租车数据以及我们如何小费
使用大数据集进行计算 - 纽约大学 Courant 研究所 - 2014 年秋季
项目作者:
林,艾米丽
刘,托马斯
肖·苏珊托,比利
主要工具
Python(主要语言)
iPython Notebook(主平台)
GeoPy(用于反向地理编码)
熊猫(用于数据分析)
Tableau(用于数据可视化)
数据
该项目使用数据,他向纽约市出租车和豪华轿车委员会索取了 2013 年纽约市的所有出租车乘车数据。 祝福他的心。 我们获取了所有旅行信息,以及所有票价。
我们抽样了大约 7500 万次乘车 (>= 30GB) 以进行以下分析。
数据分析
基本信息(每点 1 张幻灯片)
哪个街区乘坐出租车最多(接送):1) 前 10 名列表 2) 饼图 - “top neighbor.csv”
哪个是最受欢迎的出租车社区(下车) 1) 前 10 名
【文件预览】:
BigDataProject-master
----presentation()
--------3.png(218KB)
--------2.jpg(86KB)
--------1.jpg(15KB)
--------bigdatapres.pptx(749KB)
----geolocator()
--------.ipynb_checkpoints()
--------geolocator_data.csv(11KB)
--------Data 1.ipynb(86KB)
--------NYC Taxi Data.ipynb(797KB)
--------Final()
--------preprocess_geopy.py(2KB)
--------geolocator_creater.py(2KB)
--------Data 1()
--------preprocess_offline.py(2KB)
----viz()
--------geolocator_data.csv(8KB)
--------avg_speed_per_hour.csv(358B)
--------payment_type_time.xlsx(15KB)
--------new_trip_data_1_5.csv(3.82MB)
--------avg_farep_1000k.csv(389B)
--------datavis.twb(402KB)
--------avg_farep_10k.csv(2KB)
--------top_drop_neighborhood.csv(737B)
--------payment_type_neighborhood.csv(24KB)
--------tip_by_distance.csv(446B)
--------avg_farep_100k.csv(1KB)
--------top_pick_neighborhood.csv(732B)
--------avg_tip_neighborhood.csv(6KB)
--------avg_farep_neighborhood.csv(6KB)
--------avg_tip_by_hour.csv(359B)
--------payment_type_time.csv(370B)
--------count_by_pickup_hour.csv(362B)
----README.md(2KB)
----.gitignore(103B)