代码之家  ›  专栏  ›  技术社区  ›  Hariom Singh

熊猫在两个excel中组合数据

  •  1
  • Hariom Singh  · 技术社区  · 7 年前

    我有两个excel

    Excel 1

    files   language    blank   comment code
    15       C++            66  35      354
    1       C/C++ Header    3   7        4
    

    电子表格2

    files   language    blank   comment code
    16       C++           33   35      354
    1       C/C++ Header    3   7        4
    1       Python          1   1        1
    

    尝试合并Excel

    files   language    blank   comment code
    31       C++           99   70      708
    2       C/C++ Header    6   14       8
    1       Python          1   1        1
    

    关于熊猫的任何提示

    2 回复  |  直到 7 年前
        1
  •  1
  •   jezrael    7 年前

    使用 concat 含骨料 sum 通过 groupby 以下内容:

    df = pd.concat([df1, df2]).groupby('language', as_index=False).sum()
    print (df)
           language  files  blank  comment  code
    0           C++     31     99       70   708
    1  C/C++ Header      2      6       14     8
    2        Python      1      1        1     1
    

    如果列的顺序很重要,则添加 reindex 以下内容:

    df=pd.concat([df1, df2]).groupby('language',as_index=False).sum().reindex(columns=df1.columns)
    print (df)
       files      language  blank  comment  code
    0     31           C++     99       70   708
    1      2  C/C++ Header      6       14     8
    2      1        Python      1        1     1
    
        2
  •  0
  •   AYUSH SHARMA    7 年前

    你可以用


    pd.merge(df1, df2, how='inner')
    

    合并

    这是合并两个或多个数据帧的最简单方法。 有关更多信息,请阅读熊猫纪录片。 http://pandas.pydata.org/pandas-docs/stable/