文件名称:平面文件-writing science how to write papers that get cited and proposals that get funded
文件大小:4.73MB
文件格式:PDF
更新时间:2024-06-27 12:19:34
BI DW 数据仓库 ETL
4.7 平面文件 流程检查 规划与设计:需求/现状 -> 架构 -> 实现 -> 测试/发布 数据流:抽取 -> 清洗 -> 规格化 -> 提交 平面文件广泛应用于任何数据集结应用系统。在大多数数据仓库环境中,你 不可能避免平面文件。ETL 过程利用平面文件至少有三个原因: 传输源数据。当数据源在主机系统或外部系统中时,以平面文件 FTP 到 数据集结区是很平常的。来自个人数据库或电子表格的数据常常也通过 平面文件传输。 工作表/集结表。工作表是 ETL 过程为自己使用专门创建的。最常见的情 况是,使用平面文件是因为直接从文件系统读写的 I/O 速度远远快于插 入和查询 DBMS 系统。 块加载准备。如果 ETL 工具不支持数据流程中的块加载,或是想为安全 或归档原因装载一个文件,在所有的数据转换完成后,你需要在文件系 统上创建一个平面文件。一旦创建了这个平面文件,则块加载过程就可 以读取这个文件并加载它到数据仓库中。 不是所有的平面文件都是相同的。平面文件基本上分为两种: