文件名称:固定长度平面文件显示-canon eos 70d数码单反摄影圣经
文件大小:4.73MB
文件格式:PDF
更新时间:2024-06-29 05:56:26
数据仓库 ETL SSIS
图表 3.12 固定长度平面文件显示 大多数 ETL 工具很可能必须手工一次性输入平面文件的布局文件。输入布局 之后,工具会记住这个布局并在每次访问实际的平面文件时使用相同的布局。如 果文件布局改变了或数据超出了原来分配的位置,ETL 处理程序会失败。不幸的 是,不像 XML,当你处理固定长度平面文件时不会发生隐含的布局文件有效性检 验――在数据处理之前明确的预处理测试必须成功通过。 当处理固定长度平面文件时,尝试检验文件中数据的位置是否是正确的。一 种快速检验位置有效性的办法是测试任意日期(或时间)字段以确认其是一个 有效的日期。如果产生了移位,日期字段很可能包含希腊字母或不合逻辑的数 字。其它具有非常特定含义的字段也可以用同样的方法来测试。XML 提供更加 具体的有效性检验功能。如果数据校验或一致性是一个问题,试着说服数据提 供者以 XML 格式提交数据。 基于位置的平面文件一般在文件系统中以.TXT 作为后缀。然而,基于位置的 平面文件实际可以用任何文件扩展名――或根本没有――都可以以同样的方式 处理。 处理有分隔符的平面文件 平面文件一般用一套分隔符分割文件中的数据字段。分隔符代替了使用位置 来说明字段的开始和结束位置。分隔符文件可以用任意符号或符号组来分割平面 文件的字段。最常用的分隔符是逗号。逗号分隔符文件常常以.CSV 作为文件扩展