1.创建数据(文本以tab分隔)
2.创建新表
3.导入数据test1_hive到t_hive表
4.查看表数据
查看表
正则表达式匹配表名
查看表数据
查看表结构
5.修改表
增加字段
修改表名
6.删除表
7.hive交互式模式
8.数据导入
之前已经导入了数据,现在HDFS中查找刚刚导入的数据
从其他表导入数据
仅复制表结构不导数据
9.数据导出
从HDFS复制到HDFS其他位置
查看复制
通过Hive导出到本地文件系统
查看本地操作系统
10.Hive查询HiveQL
普通查询:排序,列别名,嵌套子查询
连接查询:JOIN
聚合查询1:count, distinct
聚合查询2:count, avg
聚合查询3:GROUP BY, HAVING
11.hive视图
删除视图
12.hive分区表
分区表是数据库的基本概念,但很多时候数据量不大,我们完全用不到分区表。Hive是一种OLAP数据仓库软件,涉及的数据量是非常大的,所以分区表在这个场景就显得非常重要。
下面我们重新定义一个数据表结构:t_hft
创建数据
创建数据表
导入数据
查看分区表
查询数据
13.动态写入分区表
创建分区表
导入数据
批量导入新建的分区表