文件名称:数据质量问题来源-数据库系统基础 初级篇-第5版-高清-完整目录-2007年10月
文件大小:8.73MB
文件格式:PDF
更新时间:2024-07-11 23:25:45
大数据 数据治理
二、数据质量问题来源 现在的数据集成融合就和古人筑堤坝一样,古人筑堤坝是为约束河 水,扩展人类的生存空间;今人做数据集成融合,是为了挖掘数据价 值,拓展企业的生存空间。那我们就在这个比喻的前提下,分析下数据 质量问题的来源。 西汉的贾让在著名的治河文献《治河策》中提出了治理河水的策 略,他认为在没有修筑大堤前,黄河“左右游荡,宽缓而不迫”,后来筑 堤后,河道变窄,发生洪水时泄流不畅,常决口为患。 在企业信息化初期,各类业务系统恣意生长,这个阶段就像没有修 筑大堤前的黄河,河水虽然漫流,但是河道宽阔,虽然也有数据问题, 但不明显。 后来业务需求增长,需要按照统一的架构和标准把各类数据集成起 来,这个阶段就像筑堤束水之后的黄河,泄流不畅、决口不断等问题纷 纷出现,数据不一致、不完整、不准确等各种问题扑面而来。