【Hive】grouping sets() 函数

导读:本篇文章讲解 【Hive】grouping sets() 函数,希望对大家有帮助,欢迎收藏,转发!站点地址:www.bmabk.com

文章目录

1. 语法

grouping sets()函数是一种将多个group by逻辑写在一个sql语句中的便利写法。

等价于将不同维度的GROUP BY结果集进行UNION ALL。

GROUPING__ID是分组编号,从1开始。

比如:

-- 第一个sql
select a, b, c from t group by a

-- 第二个sql
select a, b, c from t group by b

-- 第三个sql
select a, b, c from t group by a, b

-- 将这3个查询结果合在一起有
select a, b, c from (select a, b, c from t group by a)
union all
select a, b, c from (select a, b, c from t group by b)
union all
select a, b, c from (select a, b, c from t group by a, b)

-- 将这两个合在一起的更简单的写法:使用 grouping sets
select a, b, c from t
group by a, b
grouping sets (a, b, (a, b))

2. 例子

  1. cookie_info.txt 文件:

    2018-03,2018-03-10,cookie1
    2018-03,2018-03-10,cookie5
    2018-03,2018-03-12,cookie7
    2018-04,2018-04-12,cookie3
    2018-04,2018-04-13,cookie2
    2018-04,2018-04-13,cookie4
    2018-04,2018-04-16,cookie4
    2018-03,2018-03-10,cookie2
    2018-03,2018-03-10,cookie3
    2018-04,2018-04-12,cookie5
    2018-04,2018-04-13,cookie6
    2018-04,2018-04-15,cookie3
    2018-04,2018-04-15,cookie2
    2018-04,2018-04-16,cookie1
    
  2. 导入数据

    CREATE TABLE cookie_info(
    	month STRING,
    	day STRING,
    	cookieid STRING
    ) ROW FORMAT DELIMITED
    FIELDS TERMINATED BY ',';
    
    load data local inpath '/root/hivedata/cookie_info.txt' into table cookie_info;
    
    select * from cookie_info;
    
  3. 分别统计每一天的cookie和每月的cookie并联合在一张表中

    SELECT
    month,
    day,
    COUNT(DISTINCT cookieid) AS nums,
    GROUPING__ID
    FROM cookie_info
    GROUP BY month,day
    GROUPING SETS (month,day)
    ORDER BY GROUPING__ID;
    

    结果:
    在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/84519.html

(0)
小半的头像小半

相关推荐

极客之音——专业性很强的中文编程技术网站,欢迎收藏到浏览器,订阅我们!