文件名称:数据仓库调研.docx
文件大小:541KB
文件格式:DOCX
更新时间:2022-07-03 04:42:49
技术
数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。 数据仓库 比较流行的有:AWS Redshift, Greenplum, Hive等 (1)面向主题:指数据仓库中的数据是按照一定的主题域进行组织。 (2)集成:指对原有分散的数据库数据经过系统加工, 整理得到的消除源数据中的不一致性。 (3)相对稳定:指一旦某个数据进入数据仓库以后只需要定期的加载、刷新。 (4)反映历史变化:指通过这些信息,对企业的发展历程和未来趋势做出定量分析预测。