ETL_面试资料

时间:2015-11-21 10:27:37
【文件属性】:
文件名称:ETL_面试资料
文件大小:31KB
文件格式:DOCX
更新时间:2015-11-21 10:27:37
ETL 面试 1. 在数据抽取阶段,我们需要连接到源系统,为了对源系统的影响尽量小,我们需要将抽取的数据保存成文本文件或者放入数据准备区的表中,这样,当ETL过程出现错误而失败时,我们就可以从这些文本文件开始ETL,而不需要再次影响源系统。这种存储数据的方式叫数据准备区。 1) 固定格式的文本文件。Flat File指的是一种保存在系统上的一种文本文件格式,它以类似数据库的表的方式用行和列来保存数据。这种文件格式经常用来进行数据交换。用于保存数据不太合适。 2) XML数据集。多用于数据交换,用户保存数据不太合适。 3) 关系数据库的表。保存数据的较理想选择。 4) 独立的数据库表。独立的数据库表一般指建立的表和其他表没有外键约束关系。这样的表多用于数据处理。 5) 三范式或者关系型模型。 6) 非关系型数据源。非关系型数据源一般包括COBOL copy books、VSAM文件、Flat文件、Spreadsheets等。 7) 维度模型。 8) 原子事实表和聚集事实表。 9) 代理键查找表。

网友评论