numpy数据集练习 ----------sklearn类

时间:2024-06-07 15:03:56

# 1. 安装scipy,numpy,sklearn包
import numpy
from sklearn.datasets import load_iris # 2. 从sklearn包自带的数据集中读出鸢尾花数据集data
print(data.data)

  numpy数据集练习  ----------sklearn类

# 3.查看data类型,包含哪些数据
data = load_iris()
print(data.keys())

  numpy数据集练习  ----------sklearn类

# 4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型
print(data.target_names)
print(data.target)
type(data.target)

  numpy数据集练习  ----------sklearn类

# 5.取出所有花的花萼长度(cm)的数据
print(numpy.array(list(len[0] for len in data['data'])))

  numpy数据集练习  ----------sklearn类

# 6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据
print(numpy.array(list(len[2] for len in data['data'])) )
print(numpy.array(list(len[3] for len in data['data'])))

  numpy数据集练习  ----------sklearn类

# 7.取出某朵花的四个特征及其类别。
print(data.data[0])
print(data.target_names[0])

  

numpy数据集练习  ----------sklearn类

# 8.将所有花的特征和类别分成三组,每组50个
setosa_data = []
versicolor_data = []
virginica_data = []

  

# 9.生成新的数组,每个元素包含四个特征+类别

for i in range(0,150):
#生成为setosa类的鸢尾花花数据
if data.target[i] == 0:
data1 = data.data[i].tolist()
data1.append('setosa')
setosa_data.append(data1)
#生成为versicolor类的鸢尾花数据
elif data.target[i] == 1:
data1 = data.data[i].tolist()
data1.append('versicolor')
versicolor_data.append(data1)
#剩下的为virginica类的鸢尾花数据
else:
data1 = data.data[i].tolist()
data1.append('virginica')
virginica_data.append(data1)
#生成新的数组,每个元素包含四个特征+类别
newdata=(setosa_data ,versicolor_data,virginica_data)
print(newdata)

  

numpy数据集练习  ----------sklearn类