|
|
1
1
作为我博士工作的一部分,我有一个大型数据分析项目。它有许多不同的步骤,我们必须做。有些步骤相互依赖,有些步骤是独立的。下面是生成的具有依赖关系流的图表。蓝色节点是数据,白色节点是脚本/任务,黄色节点是生成的报告。您可以看到某些任务如何依赖某些数据并生成其他数据:
为了运行这些,我们可以使用任务并行。一旦我们
为了利用任务并行化,您需要有一系列不同的任务。当您只有一个任务时,您所能做的就是对数据进行并行化。 |