文件名称:Accelerate Your Hive Query
文件大小:682KB
文件格式:PDF
更新时间:2020-06-05 04:06:43
Hive Query
Apache Hive是Hadoop生态圈中比较流行的大数据数据库引擎。在本次演讲中,涵盖一些新的Hive性能提升的优化,包括了最新Spark引擎升级到2.0,Parquet数据类型的向量化支持,以及nested column pruning等新特性。并介绍配置选项从而达到优化的性能。及benchmark数据来展现这些特性能够给Hive带来的性能提升。