多维分析可以对以多维形式组织起来的数据进行上卷、下钻、切片、切块、旋转等各种分析操作,以便剖析数据,使分析者、决策者能从多个角度、多个侧面观察数据库中的数据,从而深入了解包含在数据中的信息和内涵。多维分析方式适合人的思维模式,减少了混淆,并降低了出现错误解释的可能性。
多维数据分析通常包括以下几种分析方法。
1.切片
在给定的数据立方体的一个维上进行的选择操作就是切片(slice),切片的结果是得到一个二维的平面数据。例如,在例2-1中对图2-1所示数据立方体分别使用条件:“委托方式=现场”、“营业部编号=02”、“时间=2011-01”进行选择,就相当于在原来的立方体中切片,结果分别如图2-2所示。
2.切块
在给定的数据立方体的两个或多个维上进行的选择操作就是切块(dice),切块的结果是得到一个子立方体,如图2-3所示。
例如,对例2-1中的图2-1所示的数据立方体使用条件:
(时间=“3月”or“4月”)and(营业部编号=“02”or“03”)and(委托方式=“现场”)
进行选择,就相当于在原立方体中切出一小块,结果如图2-4所示。
3.上卷
维度是具有层次性的,如时间维可能由年、月、日构成,维度的层次实际上反映了数据的综合程度。维度的层次越高,所代表的数据综合度越高,细节越少,数据量越少;维度的层次越低,所代表的数据综合度越低,细节越充分,数据量越大。上卷(roll-up)也称为数据聚合,是在数据立方体中执行聚集操作,通过在维级别中上升或通过消除某个或某些维来观察更概括的数据。表2-2给出了进行数据上卷操作的示例。
表2-2 部分营业部2011年度的交易量(按年合计)
营业部编号 交易量/亿元 营业部编号 交易量/亿元
01 50 03 62
02 38 04 55
4.下钻
下钻(drill-down)也称为数据钻取,实际上是上卷的逆向操作,通过下降维级别或通过引入某个或某些维来更细致地观察数据。
5.旋转
通过数据旋转(pivot or rotate)可以得到不同视角的数据。数据旋转操作相当于基于平面数据将坐标轴旋转。例如,旋转可能包含行和列的交换,或是把某一维旋转到其他维中去,对例2-1中的图2-1进行旋转后的结果如图2-5所示。