文件名称:考试系统毕业设计项目含源码-Python-Data-Cleaning-Analysis-and-Visualizations-with-Pan
文件大小:1.8MB
文件格式:ZIP
更新时间:2024-06-26 18:04:49
系统开源
考试系统毕业设计项目含源码使用 Pandas 进行 Python 数据分析和可视化 我们将探索多个数据集: 可视化条件图 在本笔记本中,我们将探索构建在 matplotlib 之上的 seaborn 可视化库。 Seaborn 对更复杂的绘图有很好的支持,具有吸引力的默认样式,并与 Pandas 库很好地集成。 我们将研究由 Kaggle 编译的新泰坦尼克号数据集。 概述:数据分为两组: I. train.csv:包含 712 名乘客的数据 II. test.csv:包含 418 名乘客的数据 两个数据集中的每一行代表泰坦尼克号上的一名乘客,以及有关他们的一些信息。 我们将使用 train.csv 文件,因为 Survived 列保留在文件中,该列描述了给定的乘客是否在坠机事故中幸存下来。 该列已在 test.csv 中删除,以鼓励参赛者练习使用数据进行预测。 以下是train.csv 中每一列的说明: •PassengerId——分配给每位乘客的数字ID。 • Survived -- 乘客是幸存下来(1),还是没有幸存下来(0)。 • Pclass -- 乘客所在的舱位。 • Nam
【文件预览】:
Python-Data-Cleaning-Analysis-and-Visualizations-with-Pandas-master
----Python_Data_Cleaning_with_pandas.ipynb(606KB)
----Visualizing_Geographical_Data.ipynb(681KB)
----Python_Data_Analysis_with_pandas.ipynb(102KB)
----Visualizing_The_Gender_Gap_Project.ipynb(847KB)
----README.md(6KB)
----Visualizing_Conditional_Plots.ipynb(440KB)
----DIstribution_And_Sampling.ipynb(62KB)