代码之家 › 专栏 › 技术社区 › giser_yugang

如何删除熊猫中每组的第一行

pandas python

giser_yugang · 技术社区 · 7 年前

我有一个这样的数据框架:

   id  values
0   1       3
1   1       6
2   1       3
3   2       7
4   2       6
5   2       3
6   2       9

我想删除每组的第一行 id ,结果如下:

   id  values
1   1       6
2   1       3
4   2       6
5   2       3
6   2       9

我试过这样做: df = df.groupby('id').agg(lambda x:x[1:]) 但是不起作用。

有人能帮我吗?提前谢谢

2 回复 | 直到 7 年前

jezrael 7 年前

使用 apply 具有 iloc :

df = df.groupby('id', group_keys=False).apply(lambda x:x.iloc[1:])
#also working, not sure if generally
#df = df.groupby('id', group_keys=False).apply(lambda x:x[1:])
print (df)
   id  values
1   1       6
2   1       3
4   2       6
5   2       3
6   2       9

或 duplicated 具有 boolean indexing :

df = df[df['id'].duplicated()]
print (df)
   id  values
1   1       6
2   1       3
4   2       6
5   2       3
6   2       9

细节 :

print (df['id'].duplicated())
0    False
1     True
2     True
3    False
4     True
5     True
6     True
Name: id, dtype: bool

zipa 7 年前

另一种方法:

df.loc[~df.index.isin(df.drop_duplicates(subset='id').index)]

推荐文章

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

3 月前

Cam · Pandas列表日期到日期时间

3 月前

jjkennedy · Pandas文本文件导入:当每个文件中存在多个表时,自动选择1个表

4 月前

Sun Jar · 在另一个系列中查找当前df值的索引,并将其添加到列中

4 月前

dietzi96 · Pandas DataFrame.to_sql随机和静默地失败,没有错误消息

4 月前

Bijan · Pandas批量更新帐户字符串

4 月前

Kernel · TypeError:Index.reindex()收到意外的关键字参数fill_value'

4 月前

Kernel · 进入熊猫的定义。系列super().reindex

4 月前

adventurous_chip_55 · 如何引爆柱子

4 月前

RKIDEV · Panda迭代行并将第n行值乘以下一(n+1)行值

5 月前