人人都是数据分析师:Tableau应用实战(四)高级数据操作

时间:2024-03-30 21:15:14

本章主要介绍如何创建分层结构、组、集、参数、计算字段、参考线与参考区间,以及如何灵活运用它们来创建视图。

*6.1节和6.2节描述了分层结构和组,两者经常结合使用以实现对数据的上钻和下钻操作;6.3
节描述了集的创建与使用方法;6.4节描述了参数的创建和使用方法;6.5节介绍了如何创建和使
用计算字段,以及表计算、详细级别表达式、百分比这3种函数的使用方法;6.6节介绍了参考线
以及参考区间在工作表视图中的使用方法,有效地丰富了所创建的视图*

分层结构:
分层结构(hierarchy)是一种维度之间自上而下的组织形式。Tableau默认包含了对某些字段
的分层结构,比如日期、日期/时间、地理角色。以日期维度为例,日期字段本身包含了“年季
度月日”的分层结构。

除了Tableau默认内置的分层结构外,针对多维数据源,由于其本身包含了维度的分层结构,
所以Tableau直接使用数据源的分层结构。针对关系数据源,Tableau允许用户针对维度字段自定
义分层结构,在创建分层结构后,将显示在维度窗口中,其字段图标为 。

创建分层结构
人人都是数据分析师:Tableau应用实战(四)高级数据操作

使用分层结构
在Tableau中,有两种方法可以进行上钻和下钻,一种是单击功能区字段前方的+或-,另一
种是在视图标题上右键选择钻取分层结构。
人人都是数据分析师:Tableau应用实战(四)高级数据操作

使用视图中的标题进行钻取

人人都是数据分析师:Tableau应用实战(四)高级数据操作

创建组
人人都是数据分析师:Tableau应用实战(四)高级数据操作
人人都是数据分析师:Tableau应用实战(四)高级数据操作

使用组
人人都是数据分析师:Tableau应用实战(四)高级数据操作

集(set)是根据某些条件定义数据子集的自定义字段,可以理解为维度的部分成员。

集的分类
根据是否能够随着数据动态变化,集可以分为两大类:常量集和计算集。其中常量集为静态集,不能跟随数据动态变化;计算集为动态集,可以跟随数据动态变化。

集的分类与比较

常量集 计算集
随着数据变化 否,静态集
允许使用的维度数量 单个或多个维度
创建方式 在视图中直接选择对象创建集

多个集之间可进行合并操作,合并后的集为合并集。

集的作用:选取维度部分成员

集主要用于筛选,通过选取维度的部分成员作为数据子集,以实现对不同对象的选取。集主
要有以下两个用处。
(1) 集内外成员的对比分析。Tableau提供了集的一对特性——内/外(in/out),通过选择“在集内/外显示”可以直接对集内、集外成员进行聚合对比分析。
(2) 集内成员的对比分析。当重点为对集内成员的分析时,可选择“在集内显示成员”,此时集的作用就是筛选器,只展示位于集内的成员。

创建集
本节采用坐席接听统计数据,分别介绍如何创建常量集和计算集,以及创建合并集的方式。

1.创建常量集:“平均每日人工服务接听量”由高到低排名前10名员工

2.创建计算集:“出勤天数”由高到低排名前1000名员工

3.创建合并集:高出勤且高人工服务接听量的员工
在Tableau中,集的合并要遵循相同维度,比如“平均每日人工服务接听量降序排名前10名员工”和“出勤天数降序排名前1000名员工”两个集都是以员工为维度进行筛选。维度不相同的两
个集原则上不能合并,即使合并成功(有些特殊情况)也容易造成误解。

集的合并有3种方式:①并集,包含两个集内的所有成员;②交集,仅包含两个集内均存在的成员;③差集:包含指定集内存在而第二个集内不存在的成员,即排除共享成员。

人人都是数据分析师:Tableau应用实战(四)高级数据操作

未完….