1. 语法
grouping sets()函数是一种将多个group by逻辑写在一个sql语句中的便利写法。
等价于将不同维度的GROUP BY结果集进行UNION ALL。
GROUPING__ID是分组编号,从1开始。
比如:
-- 第一个sql
select a, b, c from t group by a
-- 第二个sql
select a, b, c from t group by b
-- 第三个sql
select a, b, c from t group by a, b
-- 将这3个查询结果合在一起有
select a, b, c from (select a, b, c from t group by a)
union all
select a, b, c from (select a, b, c from t group by b)
union all
select a, b, c from (select a, b, c from t group by a, b)
-- 将这两个合在一起的更简单的写法:使用 grouping sets
select a, b, c from t
group by a, b
grouping sets (a, b, (a, b))
2. 例子
-
cookie_info.txt
文件:2018-03,2018-03-10,cookie1 2018-03,2018-03-10,cookie5 2018-03,2018-03-12,cookie7 2018-04,2018-04-12,cookie3 2018-04,2018-04-13,cookie2 2018-04,2018-04-13,cookie4 2018-04,2018-04-16,cookie4 2018-03,2018-03-10,cookie2 2018-03,2018-03-10,cookie3 2018-04,2018-04-12,cookie5 2018-04,2018-04-13,cookie6 2018-04,2018-04-15,cookie3 2018-04,2018-04-15,cookie2 2018-04,2018-04-16,cookie1
-
导入数据
CREATE TABLE cookie_info( month STRING, day STRING, cookieid STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ','; load data local inpath '/root/hivedata/cookie_info.txt' into table cookie_info; select * from cookie_info;
-
分别统计每一天的cookie和每月的cookie并联合在一张表中
SELECT month, day, COUNT(DISTINCT cookieid) AS nums, GROUPING__ID FROM cookie_info GROUP BY month,day GROUPING SETS (month,day) ORDER BY GROUPING__ID;
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/84519.html