数据仓库系列(17):数据可视化

时间:2024-05-31 15:56:09

(一)数据可视化的目的

数据仓库除了有各种技术框架及理论模型外,还有一项比较重要的工作:数据可视化。试想我们在统计完成各类数据之后,如果没有系统的报表呈现,那么数据仓库的价值,便少了一种神圣的光环。那么数据可视化的作用是怎样的?

通常来说,数据可视化在于通过相关的前端图形控件和丰富的色彩信息,将关键数据和特征直观地传达出来,从而能够在更多维的层面上来看待数据背后隐藏的商业信息。我们看到的数据可视化报表,其展示过程本身就已经加入了数据开发人员对当前统计项目的思考、理解、甚至是一些假设,而数据可视化则是通过一目了然地方式,帮助数据平台的使用者获得客观数据层面的引导或者验证。

可以说,数据可视化并不只是把图表做得好看,也不是处于邀功的目的,把简单的分析过程做得很复杂,更不是为了大数据而搞很多数据,而是为了解决实际问题。数据可视化的核心是为了更清晰的传递信息,把复杂多维的数据用图表展现,一眼明目知道结果,是把复杂问题简单化的过程实现。

(二)数据可视化的主要表现形式

1. 数字文本:以直观的形式展示数据原本的形态;

2. 数据表格:类似Excel的数据展示方法仍然是最高效的阅读数据方式;

3. 报表图形:常见的图形有柱状图、条形图、饼图,能够比较直观的看到数据背后反映的统计问题;

4. 思维导图:一种更为直观的表达思维逻辑的方式;

5. 数字地图:通过更为全景的动态数据展示方式,给使用者观察数据背后反映的相关统计趋势或走向。

(三)数据可视化需要思考的问题

1. 哪些是可以公开的数据?对于数据仓库而言,数据有安全性的概念,一些敏感的数据是不能直接展示出来的,因而有必要根据自身的业务逻辑,对相关不能直接展示的数据进行权限认证或者隐藏数据细节;

2. 数据应该如何刷新?统计数据分为离线与实时数据,离线数据统计完成后一般不需要再次刷新,但实时数据需要经常性的更新,因而选择合适的刷新方式比较重要,一般情况下采用接口提供最新数据,展示段采用Ajax组件定时访问接口,获得最新数据;

3. 如何选择展示的维度?很多数据信息是不需要报表展示的,但也有一些看起来不重要的数据,是产品或者分析人员强烈需要报表展示的,因而有必要设置一种动态配置的方式,方便使用人员自行配置报表,以提高使用效率;

4. 应该使用哪种可视化方式?数据可视化并不止于上述提到的五种方式,还有很多其他的图形控件可以选择,因而根据自身的业务过程,选择能够体现不同形式的报表控件尤为重要;

5. 是否所有的数据都应该数据可视化?这个取决于实际使用需求,还是需要跟产品人员仔细核对。

(四)数据可视化的过程

1. 确定数据可视化的主题:即确定需要可视化的数据是围绕什么主题或者目的来组织的。

2. 提炼可视化主题的数据:确定数据围绕什么主题进行组织之后,我们接下来要了解我们拥有哪些数据,如何来组织数据。这里主要包括三个方面:确定数据指标、明确数据间的相互关系、确定用户关注的重点指标。

3. 根据数据关系确定图表:数据之间的相互关系,决定了可采用的图表类型。

4. 进行可视化布局及设计:这一步包括了两个阶段,分别是页面布局及图表制作。

(五)典型的数据可视化案例:以百度为例

笔者目前所见比较优秀的数据可视化框架为:百度Echarts,能够在多维度多设备上较好的支持报表功能,并提供了折线图、柱状图、散点图、K线图、雷达图在内的十几种展示方式,示例如下:

数据仓库系列(17):数据可视化

数据仓库系列(17):数据可视化

数据仓库系列(17):数据可视化

 

同时,以百度数据可视化官网为例,展示常见的数据可视化页面:

 

数据仓库系列(17):数据可视化

数据仓库系列(17):数据可视化

数据仓库系列(17):数据可视化

数据仓库系列(17):数据可视化

数据仓库系列(17):数据可视化