一、数据可视化
根据目标的不同,数据可视化可以分为探索性分析和解释性分析:
- 探索性分析:探索、理解数据,并找出事先不确定、但值得关注或分享的信息;
- 解释性分析:向受众解释确定的问题,并有针对的进行交流和展示。
二、为什么用数据可视化
1、大数据的4V特征
- Volume:数据量大
- Veolcity:速度要求快
- Variety:数据类型多
- Value:价值密度低,商业价值高
2、大数据的挑战
- 数据!=有价值的信息
- 目标根据数据获得知识
- 所以需要对数据以某种方式进行整理、分析和展示
三、数据可视化呈现了哪些特征
- 高维
- 交互
- 动态
四、数据类型
- 结构数据:也可以称之为表格数据,由观测和特征构成
- 非结构数据:
- 树状数据:由节点和特征构成
- 网络数据:由节点、边、特征构成
- 文本数据:由词、观测构成
- 时间数据:由时间戳、观测构成
- 空间数据:地理位置、网格、观测构成
- ......
五、数据尺度
1、定性数据
- 定类:“大学”={北京大学,清华大学,中国人民大学}
- 定序:“收入水平”= {低,中,高}
2、定量数据
- 定距:“摄氏温度”={36.5,37,40,45,80}
- 定比:“身高”=170,169,180,188,190
定距与定比的区别在于,定距并没有绝对0值(即没雾绝对意义),而定比有绝对0值,可加减也可乘除。
六、数据可视化工具小结
六、数据可视化元素---视觉编码(Visual Encode)
1、Bertin视觉变量包括:
- 位置(Position):水平、垂直、坐标轴、趋势、离群、群集;
- 大小(Size):使用长度/高度(一维)、面积(二维)、体积(三维)的大小来表示数值的大小;
- 形状(Shape):线型(如直线、虚线)、符号(如三角形、正方形)、Icon小图标(如房屋、飞机);
- 数值(Value):如一个房屋Icon小图标代表述职5,那么两个则代表10;
- 色相(Hue):色彩的基本属性,即红橙黄绿青蓝紫
- 方向(Orientation):空间中的向量的斜度
- 纹理(Texure)
2、注释(是一种非图形视觉编码)包括:
- 标题:对图表的概述
- 图例:对图表元素的注释
- 离散型数据图例
- 连续性数据图例
- 坐标轴
- x轴
- y轴
- 标签:快速关注需要关注的内容(比如标出拐点)
3、字体(是一种非图形视觉编码)
4、对视觉编码进行小结
5大图形编码(位置、大小、形状、方向、坐标系),4大非图形编码(注释、字体、颜色、纹理)