代码之家  ›  专栏  ›  技术社区  ›  The Great

如何填补数据帧中重复索引的空白?[重复]

  •  1
  • The Great  · 技术社区  · 4 年前

    我有一个如下所示的数据帧

    tdf = pd.DataFrame({'grade': np.random.choice(list('AAAD'),size=(5)),
                       'dash': np.random.choice(list('PPPS'),size=(5)),
                       'dumeel': np.random.choice(list('QWRR'),size=(5)),
                       'dumma': np.random.choice((1234),size=(5)),
                       'target': np.random.choice([0,1],size=(5))
    })
    

    我正在尝试使用一些输入列创建一个多索引数据框

    所以,我尝试了下面的方法

    tdf.set_index(['grade','dumeel'],inplace=True)
    

    但是,这会导致重复条目的缺失/间隙(以红色突出显示)

    enter image description here

    我如何避免这种情况,并用所有索引显示我的数据帧(无论它是否重复)

    我希望我的输出基于原始数据帧,具有相应索引的所有行

    1 回复  |  直到 4 年前
        1
  •  1
  •   jezrael    4 年前

    这只是显示问题:

    tdf.set_index(['grade','dumeel'],inplace=True)
    
    print (tdf)
                 dash  dumma  target
    grade dumeel                    
    A     W         S    855       1
          R         P    498       1
          R         P    378       0
          W         P    211       0
          W         P     12       0
          
    with pd.option_context("display.multi_sparse", False):
        print (tdf)
                 dash  dumma  target
    grade dumeel                    
    A     W         S    855       1
    A     R         P    498       1
    A     R         P    378       0
    A     W         P    211       0
    A     W         P     12       0