Apache Hadoop---Sqoop.docx

时间:2020-06-12 17:41:45
【文件属性】:
文件名称:Apache Hadoop---Sqoop.docx
文件大小:1.09MB
文件格式:DOCX
更新时间:2020-06-12 17:41:45
Hadoop SQL引擎 大数据 sqoop 分布式 Sqoop是SQL-to-Hadoop的缩写,是Hadoop的周边工具,它的主要作用是在结构化数据存储与Hadoop之间进行数据交换。Sqoop可以将一个关系型数据库(例如MySQL、Oracle、PostgreSQL等)中的数据导入Hadoop的HDFS、Hive中,也可以将HDFS、Hive中的数据导入关系型数据库中。Sqoop充分利用了Hadoop的优点,整个数据导入导出过程都是用MapReduce实现并行化,同时,该过程中的大部分步骤自动执行,非常方便。

网友评论