|
|
1
6
这没有什么区别,在spark中,RDD只有在缓存时才会被带入内存。因此,为了实现相同的效果,您可以缓存较小的RDD。另一件你可以在火花中做的事,我不确定猪会做,就是如果所有RDD都有相同的分区,那么就不需要进行洗牌。 |
|
|
nxn · ADX Kusto如何合并两个大表 1 年前 |
|
|
DSA · 基于R中的引用将矢量的值替换为数据帧列的值 1 年前 |
|
|
Altin Mag. · 如何将spark连接到mongodb? 2 年前 |
|
|
CompEng · 如何通过查看我的两个秋天来复制行? 2 年前 |
|
|
RefiPeretz · SPARK聚合基于一列的所有列[重复] 7 年前 |