hive之分区排序窗口函数

小半 • 2023年2月11日上午9:40 • Python • 阅读 313

导读：本篇文章讲解 hive之分区排序窗口函数，希望对大家有帮助，欢迎收藏，转发！站点地址：www.bmabk.com

row_number：它会为查询出来的每一行记录生成一个
序号，依次排序且不会重复。
rank&dense_rank：在各个分组内，rank()是跳跃排
序，有两个第一名时接下来就是第三名，dense_rank()
是连续排序，有两个第一名时仍然跟着第二名。

需求1：2019年1月，用户购买商品品类数量的排名

 select user_name,count(distinct goods_category),
row_number()over(order by count(distinct goods_category)desc),
rank() over(order by count(distinct goods_category)desc),
dense_rank() over(order by count(distinct goods_category)desc)
from user_trade
where substr(dt, 1, 7) = '2019-01'
group by user_name;

– 需求5：选出2019年支付金额排名在第10、20、30名的用户

select a.user_name,a.total_amount,a.total_rank
from
(select user_name,sum(pay_amount)as total_amount,
rank() over(order by sum(pay_amount)) as total_rank
from user_trade
where year(dt)=2019
group by user_name)a
where a.total_rank in (10,20,30);

– 为什么这里的2019没有引号？前面的2019-01有引号？
– year()函数获取出的内容可以和数字或字符串进行比较
– substr()截取的就是字符串类型就已经限定了只能和字符串比较

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

文章由极客之音整理，本文链接：https://www.bmabk.com/index.php/post/98022.html

赞 (0)

0 0

Python

一文打尽python-web开发的signal机制

000402

小半
2023年12月4日
Python

python爬虫实战之爬取QQ音乐

000707

小半
2022年12月31日
Python

Django加Vue电商项目实战19 实现用户数据分页

000523

小半
2022年11月2日
Python

Python使用FastAPI开发CRUD接口完整案例

000956

小半
2022年11月2日
Python

自动化脚本如何切换环境？Pytest这些功能你必须要掌握

000225

飞熊
2023年3月5日
Python

开放GIS标准OGC之路（3）之 WFS初探

000297

飞熊
2023年9月5日
Python

【python】python推导式——列表/元组/字典/集合推导式

000311

小半
2022年10月28日
Python

Android stduio 开发百度地图API版本4.5（1）

000263

飞熊
2023年4月18日
Python

Python中12个常用模块的使用教程

000325

小半
2024年2月23日
Python

一篇全网最详细的python之函数

000259

python学霸
2024年4月14日
Python

talking-assist，一个Python中非常有用的库

000601

小半
2024年9月9日
Python自学教程教程

Python基础-24-装饰器

000301

小半
2024年1月11日

极客之音——专业性很强的中文编程技术网站，欢迎收藏到浏览器，订阅我们！