- 什么是Talend
Talend Open Studio是Talend(拓蓝)公司开发的一个数据集成的数据ETL软件,可以简化数据处理流程,降低入门门槛,不需要掌握专业的ETL知识,仅仅通过web界面和简单的组件拖拽就可实现数据处理。可以协助企业利用更多数据,不断提高其数据的可用性、可靠性以及有用性。BI工具Talend Open Studio功能强大,可以同步多种数据库,可以清洗、筛选、java代码处理数据、数据导入导出,内联查询多种数据库,以下简称talend。
概况来说,talend特点主要有以下几点:
数据源:各种常用数据库(mysql oracle hive),文件等。
速度:需要手工调整,对特定数据源有优化。
部署:创建 java 或perl 文件,并通过操作系统调度工具来运行。
易用性:有 GUI 图形界面但是以 Eclipse 的插件方式提供。
2. Talend特点
开源集成,快速启动
界面拖放,代码生成
最佳实践,用户社区
- Talend组成
项目存储库
设计工作区
配置选项卡
调色板
- Talend安装地址
官网地址
http://www.talend.com/
https://www.talendsa.cn
下载地址
https://download-mirror2.talend.com/tosbd/release/V7.2.1/TOS_BD-20190620_1446-V7.2.1.zip
- Windows下安装使用
5.1 概述
在实际企业开发中,都是在本地环境下进行Talend的project开发的,可以在本地运行,也可以连接远程机器运行
5.2 安装
-
安装JDK1.8及以上
-
下载Talend安装包zip文件,解压缩到任意本地非中文路径即可
-
双击TOS_BD-win-x86_64.exe启动Talend Open Studio
-
若有报错,检查JDK版本和具体报错信息
5.3 查看官方实例项目
Talend为我们提供了详细的入门案例,新学习者可以导入实例项目,查看官方提供的详细入门案例。
启动Talend时,选择导入演示项目
根据需要选择你想查看的工程,此处我们选择第一个
软件启动之后可以看到如下界面,左侧会有HBASE,HIVE,HDFS等目录,点开即可看到示例。
可以看到hdfs_get_put 这个job的流程
界面介绍