|
1
1
恐怕,知道给定并行计算的最佳设置的唯一方法是基准测试。许多变量影响性能:数据的容量和单个块的大小、计算的复杂性、它需要多少CPU和中间函数需要多少内存、函数是否释放吉尔、需要多少通信……
事实上你正在使用
一些建议是 here ,分布式仪表板将显示正在进行的操作,包括已提交图形的当前状态和正在工作线程上运行的代码的分析。这回答了评论中的问题;你回答了 不 获取行级信息,因为Dask不知道数据帧的每个分区中有多少行。 |
|
|
Bo Qiang · 使用dask对非常大的数据进行排序? 7 年前 |
|
|
Minsky · 对于具有Dask阵列和/或h5py的环路 7 年前 |
|
|
rth · Dask中具有可重用自定义图的机会缓存 7 年前 |
|
|
morganics · 删除Dask中的空分区 8 年前 |
|
Pablo · 使用dask。纸袋从\u序列计算核密度估计 8 年前 |
|
|
Julian C · dask按聚合正确使用 8 年前 |
|
|
vva · 如何使用Dask在yarn上运行并行python作业? 8 年前 |