我不知道
program.py
做。但使用起来很少见
--pipe
一起
find
. 所以我想这就是你想要的:
find data -type f | parallel -P 70 python program.py > output
用
--管子
输出来自
找到
必须至少为70 MB才能并行运行70个作业,因为默认
--block-size
为1 MB:
find data -type f | parallel --pipe -P 70 python program.py > output
如果
程序,Py
确实读取stdin上的文件名,那么您可能应该使用
--round-robin
用较小的
--block
:
find data -type f | parallel --pipe --block 1k --round-robin -P 70 python program.py > output
这将从
找到
给第一个作业第一个1千字节,给第70个作业第70千字节,给第一个作业第71千字节。