文件名称:School_District_Analysis:观察和处理熊猫数据框
文件大小:1.75MB
文件格式:ZIP
更新时间:2024-03-09 01:07:41
JupyterNotebook
School_District_Analysis 项目背景 校董会承认有学术不诚实的证据; 特别是随着托马斯高中9年级学生的阅读和数学成绩的变化。 尽管管理员不知道更改的全部范围,但他们希望通过保留未更改的成绩来保持测试标准,同时寻找在丢失数据整体完整性的情况下消除更改的成绩的方法。 完成评估后,我将报告我的结果并描述我的总体分析是否有任何变化。 概述 评估情况之后,我决定最好的方法是: 用NaN代替Thomas高中的9年级数学和阅读成绩。 将所有其他数据保留在托马斯高中九年级学生之外。 重新评估新数据集及其修订结果 结果 从我的评估中,我们可以看到某些百分比是不同的。 尽管规模很小,但基于规模,却相当重要。 此外,当我们看到阅读平均百分比时,我们发现它实际上上升了约4%。 分区前摘要 -及格率是75% -通过阅读率是85.8% -及格率为65.2% 区域后摘要 -及格率是74.8%
【文件预览】:
School_District_Analysis-master
----pandas_practice.ipynb(21KB)
----.gitignore(2KB)
----README.md(3KB)
----PyCitySchools_Challenge.ipynb(172KB)
----Resources()
--------schools_complete.csv(683B)
--------post read math averages.png(129KB)
--------overall post.png(179KB)
--------students_complete.csv(1.96MB)
--------Overall Pre.png(52KB)
--------pre read math averages.png(95KB)
--------missing_grades.csv(297B)
--------post district summary.png(38KB)
--------pre district summary.png(35KB)
----Cleaning_Data.ipynb(12KB)
----PyCitySchools_Challenge_testing.ipynb(52KB)
----Cleaning_Students_Name.ipynb(1.44MB)
----functions.ipynb(3KB)
----PyCitySchools.ipynb(219KB)
----clean_students_complete.csv(2.17MB)