1-数据可视化基础概述

时间:2024-03-01 09:53:54

一、数据可视化

根据目标的不同,数据可视化可以分为探索性分析和解释性分析:

  • 探索性分析:探索、理解数据,并找出事先不确定、但值得关注或分享的信息
  • 解释性分析:向受众解释确定的问题并有针对的进行交流和展示。

二、为什么用数据可视化

1、大数据的4V特征

  • Volume:数据量大
  • Veolcity:速度要求快
  • Variety:数据类型多
  • Value:价值密度低,商业价值高

2、大数据的挑战

  • 数据!=有价值的信息
  • 目标根据数据获得知识
  • 所以需要对数据以某种方式进行整理、分析和展示

三、数据可视化呈现了哪些特征

  • 高维
  • 交互
  • 动态 

四、数据类型

  • 结构数据:也可以称之为表格数据,由观测和特征构成
  • 非结构数据
    1. 树状数据:由节点和特征构成
    2. 网络数据:由节点、边、特征构成
    3. 文本数据:由词、观测构成
    4. 时间数据:由时间戳、观测构成
    5. 空间数据:地理位置、网格、观测构成
    6. ......

五、数据尺度

1、定性数据

  • 定类:“大学”={北京大学,清华大学,中国人民大学}
  • 定序:“收入水平”= {低,中,高}

2、定量数据

  • 定距:“摄氏温度”={36.5,37,40,45,80}
  • 定比:“身高”=170,169,180,188,190

  定距与定比的区别在于,定距并没有绝对0值(即没雾绝对意义),而定比有绝对0值,可加减也可乘除

六、数据可视化工具小结

 六、数据可视化元素---视觉编码(Visual Encode)

1、Bertin视觉变量包括:

  1. 位置(Position):水平、垂直、坐标轴、趋势、离群、群集;
  2. 大小(Size):使用长度/高度(一维)、面积(二维)、体积(三维)的大小来表示数值的大小;
  3. 形状(Shape):线型(如直线、虚线)、符号(如三角形、正方形)、Icon小图标(如房屋、飞机);
  4. 数值(Value):如一个房屋Icon小图标代表述职5,那么两个则代表10;
  5. 色相(Hue):色彩的基本属性,即红橙黄绿青蓝紫
  6. 方向(Orientation):空间中的向量的斜度
  7. 纹理(Texure)

2、注释(是一种非图形视觉编码)包括:

  • 标题:对图表的概述
  • 图例:对图表元素的注释
    • 离散型数据图例
    • 连续性数据图例
  • 坐标轴
    • x轴
    • y轴
  • 标签:快速关注需要关注的内容(比如标出拐点)

3、字体(是一种非图形视觉编码)

4、对视觉编码进行小结

  5大图形编码(位置、大小、形状、方向、坐标系),4大非图形编码(注释、字体、颜色、纹理)