文件名称:Project-2-调查数据集TMDB电影
文件大小:7.62MB
文件格式:ZIP
更新时间:2024-03-06 12:49:37
JupyterNotebook
Project-2-调查数据集TMDB电影 该项目是Udacity Data Analyst Nanodegree计划的一部分。 项目定义:分析数据集,然后传达您对它的发现。 使用Python库NumPy,Pandas和Matplotlib使您的分析更加轻松。 它包含4个部分: 第一步-选择数据集 我选择为该项目调查的数据集是“电影发行”。 Kaggle上此数据集的链接: ://www.kaggle.com/tmdb/tmdb-movie-metadata/data 第二步-井井有条 数据整理:在报告的此部分中,您将加载数据,检查清洁度,然后修剪和清理数据集以进行分析。 确保仔细记录您的步骤并证明您的清洁决定合理。 数据清理: •删除不必要的列:删除的列为:imdb_id,受欢迎程度,主页,关键字,概述,production_companies,budget_adj,Revenue_a