![]() |
1
0
如果可能的话,我绝对建议使用
如果无法做到这一点,或者仍然遇到OOM,请尝试通过增加分区数来减少分区大小。您可以通过手动设置
看起来通过手动构造的
注意:Spark有其自身的限制,即给定键的所有分组值必须适合处理该键的机器上的内存。如果这不适用于您的数据集(即,您有非常强的密钥倾斜),那么您将 需要 按键组合而不是按键分组。 |
![]() |
2
0
请注意
|