这个问题已经有了答案:
我的Dataframe:
df=pd.DataFrame( { 'BusId':['ABC1','ABC2','ABC2','ABC4'], 'Route':[101,102,102,104] }) df
我只需要在列路由的输出中列出不同的值
预期输出:
BusId Route 0 ABC1 101 1 ABC2 102 3 ABC4 104
用途:
#if test all columns for dupes #df = df.drop_duplicates() #if multiple columns and need specify columns for test df = df.drop_duplicates(['BusId','Route']) print (df) BusId Route 0 ABC1 101 1 ABC2 102 3 ABC4 104