|
1
1
最简单的方法是提供一个块大小参数
您任务的其余部分将与任何其他“对数据帧块执行此常规操作”的工作方式相同:“map_partitions”方法( docs )。
基本上,您在逻辑DASK数据帧的每一块上运行函数,这是真正的熊猫数据帧。 您实际上可能需要在函数中使用map、apply或其他数据帧方法。
这是一种方法-你不需要地图的“输出”,你可以使用
|
|
|
Bo Qiang · 使用dask对非常大的数据进行排序? 7 年前 |
|
|
Minsky · 对于具有Dask阵列和/或h5py的环路 7 年前 |
|
|
rth · Dask中具有可重用自定义图的机会缓存 7 年前 |
|
|
morganics · 删除Dask中的空分区 7 年前 |
|
Pablo · 使用dask。纸袋从\u序列计算核密度估计 8 年前 |
|
|
Julian C · dask按聚合正确使用 8 年前 |
|
|
vva · 如何使用Dask在yarn上运行并行python作业? 8 年前 |