文件名称:dsc-exploring-your-data-lab-online-ds-pt-100719
文件大小:274KB
文件格式:ZIP
更新时间:2024-04-19 01:54:15
JupyterNotebook
探索数据-实验 介绍 在本实验中,您将使用自己的技能与统计和数据可视化来执行EDA任务。 您将继续使用在以前的实验中获得并清除的Lego数据集。 目标 你将能够: 检查我们数据集的描述性统计数据 创建可视化效果以更好地理解数据集中变量的分布 数据探索 在这一点上,您已经在调查初始数据集与进一步探索各个特征同时清理事物以进行建模准备之间进行了少量的EDA处理。 在此过程中,您将更加熟悉数据集的特定特性。 这使您有机会发现在使用数据集时遇到的困难和潜在的陷阱以及特征工程的潜在途径,这些途径可以改善模型的预测性能。 请记住,这也不是一个线性过程。 建立初始模型后,如果初始结果不能满足您的需求和期望,您可以返回并继续挖掘数据集以发现潜在的障碍,以创建其他功能并改善模型的性能。 在这里,您将继续此过程,研究某些功能的分布以及它们与目标变量的关系: list_price 。 在下面的单元格中:
【文件预览】:
dsc-exploring-your-data-lab-online-ds-pt-100719-master
----CONTRIBUTING.md(2KB)
----Lego_dataset_cleaned.csv(3.12MB)
----index.ipynb(6KB)
----LICENSE.md(1KB)
----.gitignore(64B)
----.learn(86B)
----README.md(5KB)