文件名称:蜂巢:Apache蜂巢
文件大小:47.54MB
文件格式:ZIP
更新时间:2024-02-20 09:01:09
java sql database big-data hive
Apache Hive(TM) Apache Hive(TM)数据仓库软件有助于使用SQL读取,写入和管理驻留在分布式存储中的大型数据集。 建立在Apache Hadoop(TM)之上,它提供: 通过SQL轻松访问数据的工具,从而实现数据仓库任务,例如提取/转换/加载(ETL),报告和数据分析 一种将结构强加于各种数据格式的机制 访问直接存储在Apache HDFS(TM)或其他数据存储系统(例如Apache HBase(TM))中的文件 使用Apache Hadoop MapReduce,Apache Tez或Apache Spark框架执行查询。 Hive提供了标准SQL功能,包括2003年和2011年以后的许多分析功能。 其中包括OLAP函数,子查询,公用表表达式等。 HiveSQL也可以通过用户定义的函数(UDF),用户定义的集合(UDAF)和用户定义的表函数(UDTF)扩展为用户代码。 Hive用户在执行SQL查询时可以选择3种运行时。 用户可以选择Apache Hadoop MapReduce,Apache Tez或Apache Spark框架作为执行后端。 Map