导出iris数据集
from sklearn import datasets
import pandas as np
iris_datas = datasets.load_iris()
iris_data是一个类似字典的对象。
print(iris_datas.data) # 数据集中的数据
print(iris_datas.target_name) # iris的种类
iris = (iris_datas.data, columns=['SpealLength', 'Spealwidth', 'PetalLength', 'PetalLength'])
()
(150, 4)
SpealLength Spealwidth PetalLength PetalLength
0 5.1 3.5 1.4 0.2
1 4.9 3.0 1.4 0.2
2 4.7 3.2 1.3 0.2
3 4.6 3.1 1.5 0.2
4 5.0 3.6 1.4 0.2
描述性统计
().T # 描述性统计转置
花萼长度与宽度/花瓣长度与宽度的可视化,判断是否仅依据其即可判别鸢尾花品种。
from collection import Counter, defaultdict
import matplotlib
import as plt
['-serif'] = ['SimHei']
style_list = ['o', '^', 's'] # 设置点的不同形状,不同形状默认颜色不同,也可自定义
data = iris_datas.data
labels = iris_datas.target_names
cc = defaultdict(list)
for i, d in enumerate(data):
cc[labels[int(i/50)]].append(d)
p_list = []
c_list = []
for each in [0, 2]:
for i, (c, ds) in enumerate(()):
draw_data = (ds)
p = (draw_data[:, each], draw_data[:, each+1], style_list[i])
p_list.append(p)
c_list.append(c)
(map(lambda x: x[0], p_list), c_list)
('鸢尾花花瓣的长度和宽度') if each else ('鸢尾花花萼的长度和宽度')
('花瓣的长度(cm)') if each else ('花萼的长度(cm)')
('花瓣的宽度(cm)') if each else ('花萼的宽度(cm)')
()