代码之家 › 专栏 › 技术社区 › Deep

当您并行化代码时,如何保存两个独立的CSV?

parallel-processing dataframe pandas python

Deep · 技术社区 · 1 年前

我当前正在运行此代码

def single_iteration(iter:int):
   some_parameters = 100
   data1, data2, data3, data4 = do_something()
   result = []
   for i in range(100):
       data = {'Col1':data1, 'Col2':data1, 'Col3':data3, 'Col4':data4}
       result.append(data)
   df = pd.DataFrame(result)
   return df

if __name__ == "__main__":
   run_stop = 100
   number_of_cores = int(os.environ['SLURM_CPUS_PER_TASK'])
   with multiprocessing.Pool(number_of_cores) as pool:
      results = pool.map(single_iteration, range(run_stop))
   df = pd.concat(results, ignore_index=True)
   df.to_csv(path, file_name)

然而,现在我想要两个不同的CSV,比如 df1 = pd.DaFrame[{'Col1':data1, 'Col2':data2}] 和 df2 = pd.DaFrame[{'Col3':data3, 'Col4':data4}] 和 return 在每次运行中插入它们,然后将它们分别插入并保存。

1 回复 | 直到 1 年前

miteshdabhi 1 年前

import os
import multiprocessing
import pandas as pd


def single_iteration(iter: int):
    some_parameters = 100

    data1 = [1] * 100
    data2 = [2] * 100
    data3 = [3] * 100
    data4 = [4] * 100

    result1 = []
    result2 = []

    for i in range(100):
        data1_dict = {'Col1': data1[i], 'Col2': data2[i]}
        data2_dict = {'Col3': data3[i], 'Col4': data4[i]}
        result1.append(data1_dict)
        result2.append(data2_dict)

    df1 = pd.DataFrame(result1)
    df2 = pd.DataFrame(result2)
    return df1, df2


if __name__ == "__main__":
    run_stop = 100
    number_of_cores = int(os.environ.get('SLURM_CPUS_PER_TASK', 4))

    with multiprocessing.Pool(number_of_cores) as pool:
        results = pool.map(single_iteration, range(run_stop))

    # Separate the results into two lists of DataFrames
    df1_list = [res[0] for res in results]
    df2_list = [res[1] for res in results]

    # Concatenate all DataFrames in each list
    df1 = pd.concat(df1_list, ignore_index=True)
    df2 = pd.concat(df2_list, ignore_index=True)

    df1.to_csv('df1_file_name.csv', index=False)
    df2.to_csv('df2_file_name.csv', index=False)

推荐文章

davidalayachew · 为什么我的文件有竞争条件,即使我使用了StandardOpenOption。同步?

1 年前

Anshuman Sinha · 使用OCR将多个img文件多重处理为文本

1 年前

Rishab · 在并行Java中运行函数

1 年前