代码之家 › 专栏 › 技术社区 › user2981194

对多列进行分组,然后根据最大[重复]找到唯一的行

pandas python

user2981194 · 技术社区 · 7 月前

我有一个有3列的数据框,“供应商”、“类别”和“金额”。此df是分组操作的结果,我按供应商、类别分组,并求和金额。在许多情况下,每个供应商都有多行,他们使用不同的类别,每个类别的金额也不同。我希望对df进行过滤,以便只剩下每个供应商金额最大的类别。我曾尝试将其作为groupby的一部分来实现,但没有成功,我还遵循了教程,其中显示了如何使用.max()操作,但这会导致一行显示整个df中的最高数量。任何帮助都将不胜感激——我不能分享实际数据,但这里有一个df现在的样子的例子:

我希望得到的df是什么样子的:

2 回复 | 直到 7 月前

rehaqds 7 月前

您可以使用GroupBy中的信息对数据帧进行切片:

g = df.groupby("SN")["Amount"].max()
df = df.loc[df["SN"].isin(g.index) & df["Amount"].isin(g.values)].reset_index(drop=True)
display(df)

    SN  Category    Amount
0   1   Cat2        3000
1   2   Cat22       5000

user19077881 7 月前

您可以直接获取最大行的索引,并使用它来选择这些行:

df2 = df.iloc[df.groupby('SN')['Amount'].idxmax(),:].reset_index(drop = True)

这给出了:

   SN Category  Amount
0   1     Cat2    3000
1   2    Cat22    5000

推荐文章

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

5 月前

Cam · Pandas列表日期到日期时间

5 月前

jjkennedy · Pandas文本文件导入:当每个文件中存在多个表时,自动选择1个表

5 月前

Sun Jar · 在另一个系列中查找当前df值的索引,并将其添加到列中

6 月前

dietzi96 · Pandas DataFrame.to_sql随机和静默地失败,没有错误消息

6 月前

Bijan · Pandas批量更新帐户字符串

6 月前

Kernel · TypeError:Index.reindex()收到意外的关键字参数fill_value'

6 月前

Kernel · 进入熊猫的定义。系列super().reindex

6 月前

adventurous_chip_55 · 如何引爆柱子

6 月前

RKIDEV · Panda迭代行并将第n行值乘以下一(n+1)行值

6 月前