1
|
totooooo Richard Dally · 技术社区 · 7 年前 |
![]() |
1
1
我最终通过扔掉任何联合收割机并用一个GroupByKey代替它来实现我的目标。
在GroupByKey之后,我有一个包含点击列表的PCollection(按CookieID+会话窗口分组)。然后,在每次点击时计算并设置访问ID后,我将点击列表的PCollection转换为点击列表的PCollection,并使用unpack\u list。 我不确定这是正确的方法,如果它对性能有任何影响。 |