机器学习:鸢尾花数据集

时间:2022-12-01 23:52:17

鸢尾花数据集 (Iris Flowers Dataset )(下载地址:http://t.cn/Rf8GeUq)

  鸢尾花数据集采集的是鸢尾花的测量数据以及其所属的类别。每个类的观察值数量是均等的。一共有 150 个观察值,4个输入变量和1个输出变量。
       测量数据包括:萼片长度(cm)、萼片宽度(cm)、花瓣长度(cm)、花瓣宽度(cm)。
  类别共分为三类:Iris Setosa, Iris Versicolour, Iris Virginica。该数据集可用于多分类问题。

  使用sklearn.datasets.load_iris即可加载相关数据集。
参数:

* return_X_y: 若为True,则以(data,target)形式返回数据;默认为False,表示以字典形式返回数据全部信息(包括data和target)。

加载示例:

 

>>> from sklearn.datasets import load_iris
>>> iris = load_iris()
>>> print(iris.data.shape)
>>> print(iris.target.shape)
>>> list(iris.target_names)
输出:

(150L, 4L)
(150L,)
Out[7]:
['setosa', 'versicolor', 'virginica'](分类名称)

(未完待续)