|
|
1
0
大多数流框架支持“窗口”,该窗口在窗口中收集元组(事件),并将其呈现为聚合状态。滚动窗口和滑动窗口得到广泛支持,窗口单位为计数(元组)和时间。 您可以参考以下链接了解window的概念: https://www.oreilly.com/ideas/the-world-beyond-batch-streaming-101 https://www.oreilly.com/ideas/the-world-beyond-batch-streaming-102 您可以通过窗口计算最近N分钟(可能是秒、小时左右)的元组聚合。您可能会觉得该操作是批处理,是的,您也可以通过将元组推送到外部存储来完成,并使用批处理框架进行一些聚合。 在正常情况下,批处理框架中的聚合将更有效(聚合操作是面向批处理的),但流式框架上的即时聚合不需要外部存储(如果窗口适合内存),也不需要额外的批处理框架。 |
|
|
2
0
全面了解流聚合 refer |
|
|
Ajeesh · Apache Storm(1.2.1)运输异常断管 8 年前 |
|
|
Aniruddha · 在storm群集上提交拓扑时出错 8 年前 |
|
|
kingluo · storm:bolt如何执行元组? 8 年前 |
|
|
Saurabh · 在Apache Storm中使用与多个螺栓相同的类 8 年前 |
|
|
Keshore Durairaj · 实时流数据聚合 8 年前 |
|
|
Ryanqy · 监管在风暴中意味着什么? 8 年前 |
|
|
jdowdell · 流处理架构:未来事件影响过去结果 8 年前 |