文件名称:数据挖掘的元数据管理及可集成研究
文件大小:4.88MB
文件格式:ZIP
更新时间:2011-06-27 09:57:05
元数据 数据挖掘
摘要
随着 数 据 仓库技术的不断发展,元数据在数据仓库中的作用日益显著。元数据不仅
定义了数据仓库的作用、指明了数据仓库中信息的内容和位置、刻画了数据的抽取和转
换规则、存取了数据仓库的主题和相关的各种信息,而且实现了数据仓库的管理,如修
改和跟踪数据、描述数据同步需求、衡量数据质量等功能。作为描述数据仓库的蓝图和
管理数据、知识的基本元素,用元数据来描述数据,将成为数据生产、存储、更新和再
利用的必然趋势。
数据 仓 库 元数据研究虽然得到广泛关注,但还没有建立比较成熟的理论体系,甚至
没有一个明确的定义。建立统一的数据仓库元数据模型和管理规范,是数据仓库元数据
研究领域必须解决的问题。
通过 对 现 有多维表元数据的建模方式和ERP建模体系的研究,本文确立基于ERP建
模体系的数据仓库多维表元数据建模。基于ERP建模体系,应用面向对象程序设计工具
和关系数据库工具,研究数据仓库元数据实现和管理。通过定义指标实体、维度实体、
详细类实体和关系实体,引入动态数组技术,并通过对关系数据库中二进制大对象管理,
采用属性分离算法,解决实体结构动态修改的问题。针对关联规则的挖掘过程进行深入
的研究,鉴于元数据在数据挖掘过程中起着重要的作用,基于挖掘算法的研究,对描述
和管理挖掘过程的元数据展开研究。