文件名称:什么是数据仓库-qca6410电力猫原理图
文件大小:2.93MB
文件格式:PDF
更新时间:2024-06-28 10:35:45
大数据管理 数据集成 技术 方法 最佳实践
第7章 数据仓库 7.1 什么是数据仓库 数据仓库是基于特定的数据结构(以及有关应用程序)所构建的数据的*存储库,以便为分析和报表提供 一致的数据源。面向整个组织创建的企业数据仓库(Enterprise Data Warehouse,EDW)用于对整个组织的信息 进行分析。大多数情况下,超大型组织中会有多个企业级数据仓库,每个都拥有组织中某个很大组成部分的数 据,如某个区域,或者很大的功能域。批处理数据集成方案通常用于将数据置入或者移出数据仓库。数据仓库架 构的设计要达到以下目的:为整个组织的分析提供一致可用的数据;对数据进行格式化以满足特定的分析和报表 要求;将分析报表的压力从操作型应用系统上移开;允许对历史快照数据进行分析。[1] 数据集成技术对数据仓库的功能来说是至关重要的,因此有些数据仓库专家将数据集成看成数据仓库架构技 术的一个子集。然而,数据集成对于其他数据管理领域来说同样重要,是数据管理活动的一个独立的部分。 [1]Inmon,W.H.Building the Data Warehouse(Hoboken,NJ:John Wiley & Sons,1992)。