Tableau系列视频课程(适用tableau各版本):
1.大数据可视化之敏捷BI Tableau Desktop入门培训视频课程:https://edu.51cto.com/course/4025.html
2.大数据可视化之敏捷BI Tableau视频课程入门与实战:https://edu.51cto.com/course/2958.html
3.Tableau实用图形制作大全系列视频课程:https://edu.51cto.com/course/12627.html
4.大数据可视化之敏捷BI Tableau Server高级实战培训视频课程:https://edu.51cto.com/course/3972.html
1. tableau desktop安装配置
1.1下载安装文件
安装文件区分32位与64位操作系统。本文以64位操作系统为例,64位系统中可以更充分地利用内存,性能会有较大提升,可依据自身实际情况选择版本,10.5及以后版本只有64位软件。
官网历史版本下载:http://www.tableau.com/zh-cn/esdalt。
1.2 安装
运行安装程序后,一步一步按提示进行安装,需填写一些注册信息,提示试用14天,过期重装无效。如果有试用Key,每次输入也需注册。不同的版本(包括小版本)均可试用两周。
可以在虚拟机中安装。
2. tableau desktop功能概览
2.1 tableau desktop操作界面
Tableau 工作区包含菜单、工具栏、数据窗口、含有功能区和图例的卡(面板)以及一个或多个表。表可以是工作表或仪表板。工作表包含功能区,您可向其中拖入数据字段以生成视图。您可根据自己的需要来更改功能区和卡(面板)的默认布局,包括对它们调整大小、移动和隐藏。
2.1.1 工具栏
工具栏按钮 |
说明 |
|
撤消:反转工作簿中的最新操作。您可以无限次撤消,返回到您上次打开工作簿时,即使是在保存之后也是如此。 |
重做:重复您使用“撤消”按钮反转的最后一个操作。您可以重做无限次。 |
|
保存:保存对工作簿进行的更改。 |
|
连接到数据:打开“连接到数据”页,您可以在其中创建新连接,或者从存储库中打开已保存的连接。 |
|
新建工作表:新建空白工作表。使用下拉菜单可创建新工作表、仪表板或故事。 |
|
复制工作表:创建含有与当前工作表完全相同的视图的新工作表。 |
|
清除:清除当前工作表。使用下拉菜单清除视图的特定部分,如筛选器、格式设置、大小调整和轴范围。 |
|
自动更新:控制进行更改后 Tableau 是否自动更新视图。使用下拉列表来自动更新整个工作表或只使用快速筛选器。 |
|
交换:交换“行”功能区和“列”功能区上的字段。每次按此按钮,都会交换“隐藏空行”和“隐藏空列”设置。 |
|
升序排序:根据视图中的度量,以所选字段的升序来应用排序。 |
|
降序排序:根据视图中的度量,以所选字段的降序来应用排序。 |
|
运行更新:运行手动数据查询,以便在关闭自动更新后用所做的更改对视图进行更新。使用下拉菜单来更新整个工作表或只使用快速筛选器。 |
|
成员分组:通过组合所选值来创建组。选择多个维度时,使用下拉菜单指定是对特定维度进行分组,还是对所有维度进行分组。 |
|
显示标记标签:在显示和隐藏当前工作表的标记标签之间切换。 |
|
演示模式:在显示和隐藏视图(即功能区、工具栏、数据窗口)之外的所有内容之间切换。 |
|
查看卡:显示和隐藏工作表中的特定卡。在下拉菜单上选择要隐藏或显示的每个卡。 |
|
适合选择器:指定在应用程序窗口中调整视图大小的方式。可选择“标准”、“适合宽度”、“适合高度”或“整个视图”。 |
|
固定轴:在仅显示特定范围的锁定轴以及基于视图中的最小值和最大值调整范围的动态轴之间切换。 |
|
突出显示:启用所选工作表的突出显示。使用下拉菜单中的选项定义突出显示值的方式。 |
|
|
智能显示:显示查看数据的替代方法。可用视图类型取决于视图中已有的字段以及数据窗口中的任何选择。 |
2.1.2 菜单栏
- 文件
这里主要是针对工作薄进行的操作,包括工作薄保存、新建新的工作薄、导入导出工作薄、修改工作薄语言等操作。
- 数据
这里主要是针对数据源进行的操作,包括在当前工作薄打开新的数据源、数据提取模式下刷新数据源、编辑多个数据源之间的关联关系、查看数据源数据、更名、编辑列别名、以及设置数据源筛选器。
- 工作表
这里主要是针对工作表进行图像或者数据的复制和导出、各个部件的显示与关闭、筛选器的清除等。
- 仪表板
这里主要是针对仪表板进行图像的复制和导出。
- 故事
这里主要是针对故事进行图像的复制和导出。
- 分析
这里主要是针对工作表进行查看当前所用到数据、数据分析(合计,趋势,预测)等操作。
- 地图
这里主要是针对地图进行操作,特别强调地图层里的冲蚀,可以改变地图背景色
- 设置格式
这里主要是针对工作薄进行字体等格式的修改。
- 服务器
这里主要是发布工作簿时用的。
- 窗口
这里主要是创建书签、边条显示设置;这里的书签作用很大,可以将几个人的分工以创建书签的方式整合到一个仪表盘上。
- 帮助
这里主要是查看帮助视屏、打开示例工作簿等操作。
2.1.3 卡(面板)
- 列功能区―包含“列”功能区,您可将字段拖到此功能区上以向视图添加列。
- 行功能区―包含“行”功能区,您可将字段拖到此功能区上以向视图添加行。
- 页面功能区―包含“页面”功能区,您可在此功能区上基于某个维度的成员或某个度量的值将一个视图拆分为多个页面,通过切换页面实现动画效果。
- 筛选器功能区―包含“筛选器”功能区;使用此功能区可指定要包括在视图中的值。
- 度量值功能区―包含“度量值”功能区;可使用此功能区在一个轴上融合多个度量。仅当在视图中有混合轴时,此功能区才可用。
- 颜色图例―包含视图中颜色的图例,仅当“颜色”上至少有一个字段时才可用。
- 形状图例―包含视图中形状的图例,仅当“形状”上至少有一个字段时才可用。
- 尺寸图例―包含视图中标记大小的图例,仅当“大小”上至少有一个字段时才可用。
- 地图图例―包含地图上的符号和模式的图例。不是所有地图提供程序都可使用地图图例。
- 快速筛选器―一个单独的快速筛选器卡,可用于视图中的每个筛选器。使用这些卡可以轻松地在视图中包含和排除值。
- 参数―一个单独的参数卡,可用于工作簿中的每个参数。参数卡包含用于更改参数值的控件。
- 标记―控制视图中的标记属性。存在一个标记类型选择器,您可以在其中指定标记类型(例如,条、线、区域等)。此外,“标记”卡还包含“颜色”、“大小”、“标签”、“文本”、“详细信息”、“工具提示”、“形状”、“路径”和“角度”的控件。这些控件的可用性取决于视图中的字段和标记类型。
- 标题―包含视图的标题。双击此卡可修改标题。
- 说明―包含描述该视图的一段说明。双击此卡可修改说明。
- 摘要―包含视图中每个度量的摘要,包括最小值、最大值、中值、总计值和平均值。
- 当前页面―包含“页面”功能区的播放控件,并指示显示的当前页面。仅当在“页面”功能区上至少有一个字段时,才会出现此卡。
每个卡都有一个菜单,其中包含适用于该卡的内容的常见控件。例如,可以使用卡菜单来显示和隐藏该卡。可通过单击卡右上角的箭头来访问卡菜单。
2.2 tableau desktop分析组成元素
- 工作簿
Tableau 使用的是工作簿和工作表文件结构,这与 Microsoft Excel 十分类似。工作簿包含工作表,后者可以是工作表、仪表板、故事(可以理解为仪表板与故事是一种特殊的工作表)。在工作簿内,您可以创建新工作表、清除整个工作表、复制工作表、隐藏或显示工作表以及删除工作表。Tableau 工作簿具有 .twb 或 .twbx 文件扩展名(twbx为打包工作簿),数据提取文件为hyper(老版本的文件其扩展名为tde)。
- 工作表
一个工作表包含单个视图以及功能区、图例和数据窗口。由维度、度量、筛选器等组成。
- 仪表板
一个仪表板是多个工作表中的视图的集合。
- 故事
故事是一个包含一系列共同作用以传达信息的视图或仪表板的工作表。您可以创建故事以揭示各种事实之间的关系,提供上下文,演示决策与结果的关系,或者只是创建一个极具吸引力的案例。 故事是一个工作表,因此用于创建、命名和以其他方式管理工作表和仪表板的方法同样适用于故事(请参见工作表)。同时,故事还是按顺序排列的工作表集合。故事中各个单独的工作表称为“故事点”。
2.3 Tableau desktop文件体系
- Tableau desktop存储库(元数据库)
Tableau在本地存储相关元数据(文件)的路径。安装tableau desktop时可以指定,默认为C:\Users\Administrator\Documents\我的 Tableau 存储库。存储的内容包括:数据源、工作簿、地图源、形状、样式、服务、日志、书签、额外项等内容。
- Tableau desktop 相关数据文件(待补充)
文件类型 |
文件扩展名 |
说明 |
工作簿 |
twb |
-- |
打包工作簿 |
twbx |
包含数据源等文件,可脱离数据源操作 |
数据源 |
tds |
-- |
打包数据源 |
tdsx |
包含数据源 (.tds) 文件中的所有信息以及任何本地文件数据源(Excel、Access、文本和数据提取)。此文件类型是一个压缩文件,可用于与无法访问您计算机上本地存储的原始数据的人共享数据源。 |
数据提取文件 |
tde/hyper |
数据提取文件,实时连接时不生成此文件,只有提取成TDE时才生成此文件。 |
3. tableau数据源
3.1 tableau支持的数据源
tableau支持常用的结构化数据源,包括文件类型及数据库类型数据源。对于特殊数据源可通过ODBC进行连接。
3.2 tableau连接Excel文件
1. 点击工具栏“连接到数据”;
2. 选择菜单:数据>>新建数据源,打开数据源连接窗口
点击Micosoft Excel,浏览至本地的xls,xlsx,xlsm文件,再选择sheet,转到工作表,关闭数据源即可将此数据源从当前工作簿移除。一个工作簿可连接多个数据(但只有一个主数据源)。
3.3 tableau连接Oracle数据库
3.3.1 安装tableau10.5-oracle-driver
Tableau desktop可直接连接Oracle服务器。前提是需要安装tableau针对oracle的驱动tableau10.5-oracle-driver(D)-x64.msi。下载地址: http://www.tableau.com/zh-cn/support/drivers)。(直接双击运行,过程中好像没有需要填写的信息,也没有安装成功的提示,只要后边能连上就表示没问题了)
3.3.2 连接Oracle数据源
3.3.2.1 配置连接信息
选择菜单:数据->新建数据源。或点击下图中上方的快捷按钮:
即可打开数据源连接窗口;配置Oracle数据库信息:注意需配置Oracle服务名,不是实例名,因此无需安装oracle客户端也可以直接连接Oracle服务器,如下图所示。
3.3.2.2 Oracle数据获取
登录后,依据当前用户权限可以查看不同架构(Schema)下的表或视图(支持物化视图,物化视图是Oracle针对数据仓库的三大特性之一,可实现从物理表中定时更新数据),即可以查看其它用户下的这些对象,将它们拖拽至右侧空白处提供给工作簿作为其数据源(可同时提供多张表并将其时行关联),也可通过自定义SQL(可带参数)获取多表或带有查询条件的数据集。
3.3.2.3 Oracle数据源清洗
3.3.2.3.1实时与数据提取
A 实时(实时连接数据源,建议少量数量时使用实时连接,数据量大则可能存在内存不足的问题)
数据提取(生成TDE数据文件,数据源更新后,TDE文件不实时更新,需要重新全量或增量提取,支持大数据量查询与分析),点击“提取”旁边的“编辑”按钮可设置提取的条件,点击“刷新”按钮可刷新提取(需生成TDE后才可点击该“刷新”按钮)。
控制源端的数据提取范围可以合理控制数据量,如果业务扩展,需要扩大数据范围,则需生新生成提取文件。
3.3.2.3.2 数据源筛选
通过筛选器对数据源进行筛选,包括值列表、通配符、条件、顶部等筛选规则进行筛选,其中条件、顶部可以应用公式(tableau自带函数库或外部程序)以实现更为强大的筛选功能。
这里强调一下点击数据提取后出现的编辑按钮和旁边本就有的筛选器按钮:
编辑按钮是做数据提取时,将数据进行过滤,好处是在数据源层面即做了过滤,生成TDE文件时只将需要的数据写入TDE文件,减少了TDE的文件存储,提高查看速度。
而旁边的筛选器是在TDE基础上,进行所要使用的数据筛选,相当于一个针对于所有工作表的筛选器,其余未使用数据仍存在于.TDE文件中,只需将筛选器中的条件移除即可显示。
实战:数据源去除重复数据:
在业务系统中最常见的数据问题是存在重复数据。
可以直接在数据源自定义SQL(示例)处进行筛选:
select * from T_HELUDD_ORDER_CF t whereexists (select1from (select rid,row_nu from (selectrowid rid,row_number() over (partitionby 客户编号,产品名称,订单号 orderby 订单日期 desc) row_nu from T_HELUDD_ORDER_CF) where row_nu=1) t1 where t1.rid=t.rowid) |
此示例SQL解决的是假设订单表T_HELUDD_ORDER_CF中存在重复数据(业务上客户编号,产品名称,订单号三者确定一条记录的唯一性),获取以客户编号,产品名称,订单号三者联合起来分组,取每组中重复记录中订单日期最新的一条。
3.3.2.3.3 数据源设置
- 数据源(数据表、视图、自定义SQL)别名设置
- 字段重命名
- 数据类型修改
- 隐藏字段
- 多表关联
- 字段拆分
3.3.2.4 导出数据源(tds,tdsx)
任何时候连接到数据源时,都可以导出数据源信息作为快捷方式,以后可通过此快捷方式快速连接到数据源。如果经常多次连接到同一数据源,或者已将联接表、默认属性或自定义字段(如组、集、计算字段和分级字段)添加到数据窗口中,则可能需要这样做。
数据源 (.tds) : 只包含连接到数据源所需的信息,例如数据源类型、位置和自定义字段。如果连接到本地文件数据源(Excel、Access、文本、数据提取),文件路径将存储在数据源文件中。数据源文件包含以下类型的信息:
- 数据源类型
- 在数据源页中指定的数据源连接信息(例如,服务器、端口、本地文件的位置、表等)
- 组
- 集
- 计算字段
- 默认字段属性(例如,数字格式、聚合、排序顺序等)
打包数据源 (.tdsx): 包含数据源 (.tds) 文件中的所有信息以及任何本地文件数据源(Excel、Access、文本和数据提取)。此文件类型是一个压缩文件,可用于与无法访问您计算机上本地存储的原始数据的人共享数据源。
导出数据源的方法:
方法一:在“数据”菜单上,选择数据源,然后选择“添加到已保存的数据源”。
方法二:右键点击数据源来打开“添加到已保存的数据源”对话框。
下次可直接通过“文件”-“打开”菜单打开之前保存的数据源:
导出的数据源文件可移植。
3.3.2.5 数据提取刷新(TDE追加、全量)
当基础数据发生改变时,您可以刷新数据提取,方法是在“数据”菜单中选择数据源,然后选择“数据提取”>“刷新”。可以将数据提取配置为完全刷新,从而将所有数据替换为基础数据源中的数据;或者配置为增量刷新,仅添加自上次刷新以来新增的行。
注意:这里的刷新只有在数据源连接方式是数据提取时,才会出现。
- 完全数据提取
默认情况下,将对数据提取进行完全刷新。这意味着每次刷新数据提取时,所有行都会替换为基础数据源中的数据。虽然这种刷新可确保备份,但在数据库上执行这种刷新有时需要很长时间并且开销很大,具体取决于数据提取的大小。
如果未将数据提取设置为增量数据提取,选择刷新数据提取将会完全刷新数据提取。如果要将数据源发布到 Tableau Server,则可在“计划与密码”对话框中指定刷新类型。
- 增量数据提取
您可以将数据提取设置为仅添加自上次提取数据以来新增的行,而不是刷新整个数据提取。一般以时间戳或自增主键编号进行增加刷新。
增量数据提取操作步骤:
1)在“数据”菜单中选择数据源,然后选择“数据提取”。
2)在“提取数据”对话框中,选择“所有行”作为要提取的行数。只有在提取数据库中的所有行时,才能定义增量刷新。不能将样本数据提取递增。
3)选择“增量刷新”,然后在数据库中指定将用于标识新行的列。例如,如果选择“日期”字段,则刷新将会添加日期晚于上次刷新日期的所有行。
4)完成后,单击“数据提取”。
注意:
1.TDE数据文件中的数据不能部分删除,只能追加或全量更新(删除全部后再导入数据)。
2.自动增量提取可在数据库中用日期变量实现,例如发货日期小于当前日期的: 发货日期<= sysdate (select to_char(sysdate,'yyyy-MM-dd') from dual;)
3.3.2.6 数据混合(融合)/多表关联
数据融合指在单个工作表上融合(连接)来自多个数据源(可以是异构数据源)的数据。数据在公用维度(默认名称相同)上进行联接。若要集成数据,必须先定义主数据源与辅助数据源(只能有一个主数据源)之间的公用维度。如果这两个维度不具有相同名称,则可以定义用于在字段之间创建正确映射的自定义关系。
以下示例将订单表ORDER(来源于Excel),退换表RETURN(来源于oracle)通过订单ID字段进行融合:
步骤:
- 连接Oracle数据源订单表RETURN并转成TDE/hyper文件;
- 选择菜单:数据->新建数据源,进行第二个数据源连接Excel订单表并转成TDE/hyper文件:
- 选择菜单:数据->编辑关系:将订单表设置为主数据源,以订单ID关联:
- 拖放几个维度和度量后,数据源中出现蓝色小勾的为主数据源,其它为辅数据源
总结一下,如果在tableau desktop中需实现多表关联,有到下三个方法可选:
1)通过自定义SQL编写多表关联语句,实时连接或生成TDE文件
2)通过数据源配置时拖入多个表配置关联字段进行左关联(无需写SQL)
3)多个数据源(可以是异构)进行数据融合。
3.3.2.7 替换数据源
对于已经在用的数据源,可以进行替换,替换的数据源所用到的字段应与原数据源的字段一致,否则会影响已经完成的建模工作(建议新的数据源字段数大于等于旧的)。
3.3.2.8 追加数据源
实时连接方式无法追加数据源,只有数据提取方式才可以实现追加数据源。分为从文件添加数据及从数据源添加数据两种方式。
- 从文件添加数据(TDE追加TDE)
在“数据”菜单上,选择数据源,然后选择“数据提取”>“从文件追加数据”。浏览到包含新数据的文件,然后选择该文件。
注意: 默认情况下,使用数据提取的原始数据源的文件格式。要从 Tableau 数据提取添加数据,请单击文件格式下拉列表,然后选择“Tableau 数据提取(.*tde)”。例如各省公司数据合并为全国数据。对于纵向合并的数据源结构需一致。完成后,单击“确定”。
- 从数据源添加数据(其它数据追加到TDE)
您还可以从工作簿中的其他数据源向数据提取添加新数据。当数据提取的文件类型与要添加的数据的文件类型不同时,使用此选项。例如,从包含过去十年数据的数据仓库创建数据提取。不过,新数据已保留在 Excel 工作簿中。可以使用“从数据源追加数据”命令向数据提取添加新数据。
3.3.2.9 数据源编辑
打开编辑数据源的三种方法:
- 右键数据窗口中的某一数据源,选择“编辑数据源”。
- 双击数据窗口中的某一数据源直接进入“编辑数据源”界面
- 通过菜单:数据->数据源->编辑数据源进行操作
Tableau系列视频课程(适用tableau各版本):
1.大数据可视化之敏捷BI Tableau Desktop入门培训视频课程:https://edu.51cto.com/course/4025.html
2.大数据可视化之敏捷BI Tableau视频课程入门与实战:https://edu.51cto.com/course/2958.html
3.Tableau实用图形制作大全系列视频课程:https://edu.51cto.com/course/12627.html
4.大数据可视化之敏捷BI Tableau Server高级实战培训视频课程:https://edu.51cto.com/course/3972.html