文件名称:Pands-Project2021:编程和脚本编写模块GMIT的项目存储库-2021
文件大小:1.46MB
文件格式:ZIP
更新时间:2024-05-11 00:08:03
Python
Pands-Project2021 编程和脚本编写模块GMIT的项目存储库-2021 介绍 该项目将研究通常称为“鸢尾花数据集”或“费希尔斯鸢尾花数据集”的数据。 在该项目的研究阶段,我发现对于任何想研究机器学习和/或数据可视化的统计学家或个人来说,对该数据集的研究似乎都是最初的起点。 1936年,统计学家Ronal Aylmer Fisher爵士在《优生学年鉴》(Annals of Eugenics)上发表了他的报告“在分类学问题中使用多重度量”的报告时,该数据集成为公众关注的焦点。 应当指出,费舍尔本人并没有收集数据,数据来源归功于埃德加·安德森博士,他在加拿大加斯佩半岛收集了数据。 数据集本身相对较小-3类(不同的Iris物种-Iris Setosa,Iris Versicolour和Iris Virginica),每个都有50个样本,每个样本有4个变量(萼片的长度和宽度以及花瓣