numpy数据集练习 ----------sklearn类


# 1. 安装scipy，numpy，sklearn包

import numpy

from sklearn.datasets import load_iris

# 2. 从sklearn包自带的数据集中读出鸢尾花数据集data

print(data.data)

# 3.查看data类型，包含哪些数据

data = load_iris()

print(data.keys())

　　 numpy数据集练习 ----------sklearn类

# 4.取出鸢尾花特征和鸢尾花类别数据，查看其形状及数据类型

print(data.target_names)

print(data.target)

type(data.target)

　　 numpy数据集练习 ----------sklearn类

# 5.取出所有花的花萼长度(cm)的数据

print(numpy.array(list(len[0] for len in data['data'])))

　　 numpy数据集练习 ----------sklearn类

# 6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据

print(numpy.array(list(len[2] for len in data['data'])) )

print(numpy.array(list(len[3] for len in data['data'])))

　　 numpy数据集练习 ----------sklearn类

# 7.取出某朵花的四个特征及其类别。

print(data.data[0])

print(data.target_names[0])

numpy数据集练习 ----------sklearn类

# 8.将所有花的特征和类别分成三组，每组50个

setosa_data = []

versicolor_data = []

virginica_data = []

# 9.生成新的数组，每个元素包含四个特征+类别

for i in range(0,150):

    #生成为setosa类的鸢尾花花数据

    if  data.target[i] == 0:

        data1 = data.data[i].tolist()

        data1.append('setosa')

        setosa_data.append(data1)

    #生成为versicolor类的鸢尾花数据

    elif data.target[i] == 1:

        data1 = data.data[i].tolist()

        data1.append('versicolor')

        versicolor_data.append(data1)

    #剩下的为virginica类的鸢尾花数据

    else:

        data1 = data.data[i].tolist()

        data1.append('virginica')

        virginica_data.append(data1)

#生成新的数组，每个元素包含四个特征+类别

newdata=(setosa_data ,versicolor_data,virginica_data)

print(newdata)

numpy数据集练习 ----------sklearn类

秒客网

numpy数据集练习 ----------sklearn类

相关文章