ETL--kettle-excel批量插入数据库
主要有四个步骤:
步骤一、根据指定正则获取符合该正则的本地文件。
步骤二、Excel输入控件通过一个符合标准的Excel文件配置工作表(Sheets)和字段(Fields)。
步骤三、Exce输入控件切换成[从前面的步骤获取文件名]。
步骤四、输出到数据库。
转换效果如图:
具体实现:
步骤一实现:
内容: 根据指定正则获取符合该正则的本地文件。
实现方法:通过该转换中[获取文件名]控件来实现
实现过程:
(1)填写指定的正则表达式,如图:
(2)点击[浏览]按钮,选择目录,如图:
(3)点击[增加]按钮,如图:
(4)点击[显示文件名称]按钮测试,如果能跟正则表达式批匹配上就OK,如图:
步骤二实现:
内容: Excel输入控件通过一个符合标准的Excel文件配置工作表(Sheets)和字段(Fields)。
实现方法:通过该转换中[Excel输入]控件来实现
实现过程:
(1)、表格类型下列选择Excel 2007 XLSX(Apache POI) ,点击[浏览]按钮,做一个模板来配置工作表(Sheets)和字段(Fields),
如图:
(2)、点击[增加]按钮,如图:
(3)、切换工作表点击[获取工作表名称]按钮,选择你需要的sheets,如图:
(4)、切换到[字段]点击[获取来自头部数据的字段]按钮,选择所需要的字段,如图:
以上步骤二配置成功。
步骤三实现:
内容: Exce输入控件切换成[从前面的步骤获取文件名]。
实现方法:通过该转换中[Excel输入]控件来实现
实现过程:
(1)将[从前面的步骤获取文件名]打钩
(2)[从那个步骤读文件名]下拉选择上一个步骤。
(3)[保存文件名的字段]下拉选择filename。
如图:
步骤四实现:
内容: 输出到数据库。
实现方法:通过该转换中[表输入]控件来实现
实现过程: