文件名称:hive
文件大小:12.33MB
文件格式:GZ
更新时间:2024-04-14 12:03:31
数据库
Apache Hive(TM)数据仓库软件有助于查询和管理驻留在分布式存储中的大型数据集。 它建立在Apache Hadoop(TM)之上,提供*工具,使数据提取/转换/加载(ETL)变得容易*一种将结构强加于各种数据格式的机制*访问直接存储在Apache HDFS(TM)中的文件)或其他数据存储系统(例如Apache HBase(TM))中。*通过MapReduce Hive执行查询定义了一种简单的类似于SQL的查询语言,称为HiveQL,使熟悉SQL的用户能够查询数据。 同时,该语言还允许熟悉MapReduce框架的程序员能够插入其自定义的映射器和化简器以执行该语言的内置功能可能不支持的更复杂的分析。 HiveQL还可以使用自定义标量函数(UDF),聚合(UDAF)和表函数(UDTF)进行扩展。https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-1.2.2/