上一篇我们已经完成了数据源的准备工作,现在我们就开始动手,创建第一个多维数据集(Cube)。
文章提纲
- 使用多维数据集向导创建多维数据集
- 总结Cube设计器简介
- 维度细化
- 总结
一、使用向导创建多维数据集
在Analysis Services中,可以通过3种方法构建多维数据集:自上而下,自下而上或者基于一个空多维数据集。
一般我们从现有的关系数据库自下而上构建。
在自下而上方式中,需要一个DSV作为多维数据集的构建基础。
AS中的多维数据集(Cube)包括两部分:
1. 一个或多个度量值组,其数据来自关系数据源中的一个或多个事实表。通常情况下,每个事实表对应一个度量值组,度量值组包含一个或多个度量值(例如销售额,成本,售出产品计数)
2. 多维数据集还包含一个或多个来自关系维度表的维度(例如Product和Time).
构建多维数据集时,需要指定希望使用的事实表和维度表。每个多维数据集必须至少包含一个事实表,用于确定该多维数据集的内容。
后面使用向导时可以看到,如果不选量值组会提示:At least one measure group table must be selected.
另外构建多维数据集之前,必须基于维度表创建维度。
我们简单小结一下:Cube=度量值组+维度
多维数据集向导将创建多维数据集所涉及的所有步骤打包在一起, 形成一个简单的顺序过程,创建步骤:
1. 右键 Cubes à New Cube…
点击 Next进入下一步
选择默认值,下一步
2.在Select Measure Group Table页中,选择FactInternetSales 和 FactResellerSales作为度量值组表,下一步
3. 在Select Measures页面中,可以从度量值组表中选择特定的列作为度量值。
默认情况下,会选中度量值组表中的所有列(键列除外)
按照默认选择,下一步
4. 在Select New Dimensions页面上,多维数据集向导将显示可能的维度及其特性。默认情况下,多维数据集向导在每个维度中包含键特性,键特性将在此页面上突出显示,如下图。取消选中Fact Internet Sales和Fact Reseller Sales维度,下一步。
5. 按照默认名称,点击Finish完成多维数据集的创建。
向导完成后,维度也会相应的创建,并且显示在Solution Explorer中。
二、Cube设计器简介
Adventure Works DW多维数据集将在多维数据集设计器中打开,如下图
可以看到,多维数据集设计器具有多个tab, 通过这些tab, 可以对多维数据集进行各种操作。在多维数据集向导完成后打开的默认页面是Cube Structure
其他的一些页面包括:Dimension Usage, Caculation, KPIs, Actions, Partitions, Aggregations, Perspectives, Translations和Browser
Cube Structure页面包含3个窗格:Measures(度量值)、Dimensions(维度)和Data Source View(数据源视图)。
可以在Measures窗格中添加或修改度量值组和度量值。
使用Dimensions窗格可以添加或修改多维数据集的维度。
Data Source View 窗格显示在多维数据集中使用的事实表和维度表,并使用不同颜色进行区分(黄色表示事实表,蓝色表示维度表)
在每个窗格内部右击,可以看到能够在每个窗格中完成的各种操作。
三、维度细化
多维数据集向导仅向创建的维度中添加了最为基本的一些特性。若要对多维数据集中的数据进行分析,还需要对这些维度进行进一步细化, 后续文章我们专门有一篇讲解维度的细化,下面我们先来一个维度细化示例。
1.在Solution Explorer中,双击Dim Date.dim维度。
Dim Date维度将在维度设计器中打开。
Dimension Structure页面包含3个窗格:Attributes, Hierarchies和DSV
2.在DSV窗格中,选中DimDate表中除DateKey以外的所有列,拖到Attributes窗格。该操作会为DimDate表中的每一列创建一个特性。
3. 将键特性从Date Key重命名为Date
4. 将Fiscal Quarter特性从Attributes窗格拖放到Hierarchies窗格。该操作将创建一个层次结构,称为Hierarchy.
将Month Number of Year 特性拖放到Hierarchies窗格的Fisical Quarter特性下面。该操作会在层次结构中创建另一个级别。
类似的,将Date特性拖放到Month Number of Year特性下面。
右击层次结构并选择Rename, 将层次结构重命名为Fiscal Quarter – Month Number of Year, 最终效果如下图:
我们对其他维度也做一些调整。
Dim Currency.dim
Dim Customer.dim
将键特性从 Custom Key 重命名为 Custom
将DSV中来自DimCustomer表的所有列(Custom Key除外)拖放到Attributes窗格
Dim Sales Territory.dim
将键特性从Sales Territory Key 重命名为 Sales Territory
将DimSalesTerritory表中除SalesTerritoryKey和Image以外的所有列从DSV窗格拖放到Attributes窗格。
Dim Product.dim
将键特性从 Product Key重命名为Product
将DimProduct表中除ProductKey和LargePhoto以外的所有列从DSV拖放到Attributes 窗格。
Dim Promotion.dim
将键特性从Promotion Key 重命名为 Promotion
将DimPromotion表中除PromotionKey以外的所有列从DSV窗格拖放到Attributes窗格。
将 English Promotion Category特性从Attributes窗格拖放到Hierarchies窗格。该操作将创建一个新的层次结构。
将Discount Pct特性从Attributes窗格拖放到Hierarchies窗格的English Promotion Category特性下面。该操作会在层次结构中创建一个新的level.
将Promotion特性从Attributes窗格拖放到Hierarchies窗格的Discount Pct级别下面.
重命名层次结构为English Promotion Category – Discount Pct, 如下图
Dim Reseller.dim
将键特性从Reseller Key重命名为Reseller
将DimReseller表中除ResellerKey以外的所有列从DSV窗格拖放到Attributes窗格。
将Annual Revenue特性从Attributes窗格拖放到Hierarchies窗格。改操作将创建一个新的层次结构。
将Number Employees特性从Attributes窗格拖放到Hierarchies窗格的Annual Revenue特性下面。该操作将创建一个新的level, 成为Number Employees
将Reseller特性从Attributes窗格拖放到Hierarchies窗格的Number Employees级别下面
重命名层次结构为Annual Revenue – Number of Employees , 如下图
Dim Employee.dim
该维度具有多维数据集向导创建的3个键特性,与此相对的是,其他维度创建了一个键特性。这是因为,向导在Dim Employee维度内检测到一种父子关系(后续教程介绍)
将Employee Key特性重命名为Employee
将DimEmployee表中除EmployeeKey, ParentEmployeeKey,Sales TerritoryKey和EmployeePhoto以外的所有列从DSV窗格拖放到Attributes窗格。
将Department Name特性从Attributes窗格拖放到Hierarchies窗格。该操作将创建一个新的层次结构。
将Title特性从Attributes窗格拖放到Hierarchies窗格的Department Name层次结构下面。
将Employee特性从Attributes窗格拖放进Hierarchies窗格的Title特性下面。
重命名层次结构为Department Name - Title
四、总结
现在,你已经成功使用SSDT创建了一个多维数据集,并对维度进行了细化。后续将会围绕这个例子继续进行扩展。
最后我们对本篇内容做个总结:
1. 需要了解向导创建多维数据集的顺序 :
Select Creation Meathod (Use existing tables)
-->Select Measure Group Tables
-->Select Measures
-->Select New Dimensions
-->Completing the Wizard
2. Cube设计器的结构:
包含多个tab, 每个tab包含多个窗格,熟悉这些tab和窗格。
3. 初步了解维度细化的一些操作(后续会有专题讲维度操作)
下一篇文章将会介绍如何部署这个项目到SSAS上,以及进行简单的分析。
祝学习进步:)
首发博客园 by MiroYuan,转载文章之后必须在文章页面明显位置给出作者和原文连接,否则保留追究法律责任的权利。