文件名称:hive-probabilistic-utils:hive 的概率数据结构和算法
文件大小:11KB
文件格式:ZIP
更新时间:2024-06-25 17:27:16
Java
概率蜂巢 (Alpha) hive 中的概率数据结构和算法。 目前只实现了 hyperloglog。 概要 -- estimate the cardinality of SELECT * FROM src GROUP BY col1, col2; SELECT hll(col1, col2).cardinality from src; -- create hyperloglog cache per hour FROM input_table src INSERT OVERWRITE TABLE hll_cache PARTITION (d = ' 2015-03-01 ' ,h = ' 00 ' ) SELECT hll(col1,col2) WHERE d = ' 2015-03-01 ' AND h = ' 00 ' INSERT OVERWRITE TABLE hll
【文件预览】:
hive-probabilistic-utils-master
----.gitignore(773B)
----src()
--------main()
----LICENSE(10KB)
----README.mkdn(2KB)
----pom.xml(2KB)