前言
窗口是flink作为实时计算中的一个重要的概念,也称TimeWindow, TimeWindow是将指定时间范围内的所有数据组成一个 window,一次对一个window 里面的所有数据进行计算
flink中的窗口类型
-
滚动窗口
Flink 默认的时间窗口根据 Processing Time 进行窗口的划分,将 Flink 获取到的数据根据进入 Flink 的时间划分到不同的窗口中
DataStream<Tuple2<String, Double>> minTempPerWindowStream = dataStream
.map(new MapFunction<SensorReading, Tuple2<String, Double>>() {
@Override
public Tuple2<String, Double> map(SensorReading value) throws
Exception {
return new Tuple2<>(value.getId(), value.getTemperature());
}
})
.keyBy(data -> data.f0)
.timeWindow( Time.seconds(15) )
.minBy(1);
使用TimeWindow相关API时,需要基本明确其计算模型,flink的窗口概念很像是算法中的桶的概念,即把一个时间窗口范围内的数据根据一定的业务字段分组后,归到这个“桶”中,然后基于这个“桶”中的数据做各种计算、归并等业务操作
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/143319.html