Python数据挖掘——数据概述
数据集由数据对象组成;
-
数据的基本统计描述
-
中心趋势度量
均值
中位数
众数
-
中列数
数据集的最大值和最小值的平均
-
度量数据分布
-
极差
最大值与最小值的差
四分位数
方差
四分位数极差
-
-
-
数据基本统计描述的图形显示
-
一元分布
分位数图
分位数-分位数图(q-q图)
直方图
-
二元分布
散点图
-
-
数据可视化
1、基于像素的可视化技术
2、几何投影可视化技术
3、基于图符的可视化技术
4、层次可视化技术
-
度量数据的相似性和相异性
相似 和相异 都称 邻近性
如果不相似,则称 相似性度量为