时间窗口这个咋理解,应用场景是咋样的

时间窗口这个咋理解,应用场景是咋样的

在流处理场景中,对多条数据进行聚合或者 join 时需要指定 “窗口”,窗口内的所有数据将会进行聚合或者 join 操作,以如下 SQL 为例:

select max(a) from stream group by tumblingWindow(ss,10);

这条 SQL 则是指将 stream 流中的数据以 10 秒为一个窗口单位进行切割,每个窗口内所有的数据进行聚合操作,得到 max(a) 的值。