然后我们开始来理解,waterMark的概念,可以看到.
首先,对于正常的数据流,来说可以看到,上面,从右边到左边,是1,2,3,4,5,6...代表
这些数据,是一个个流过来的,理想的情况下,假设,1秒来一个数据,我们时间窗口是5秒的话,
那么数据是,包含开始,不包含结束.所以,这里会把1,2,3,4,放到第一个时间窗口的桶中去.
然后,第二个窗口就会放,5,6,7,8...这样,这个是正常的情况.
但是实际情况一般,数据不会,1,2,3,4,5,6....的这样按照顺序来,比如下面这个视情况的图,可以看到数据的产生顺序是,1,2,3,4,5,6..但是实际上,传输的时候,可以看到是,1,4,5...这样的顺序对吧,4和5先到的,而3,2是后到的对吧.
我们知道在数据传输中,我们的时间级别,一般都是,毫秒级的,一般都是,数据几十毫秒,多的话,100,200,300毫秒就传输过来了,一般都不会达到秒级对吧.
我们之前说,比如