代码之家 › 专栏 › 技术社区 › yurnero

熊猫groupby:当前组的坐标

pandas-groupby dataframe pandas python-3.x

-1

yurnero · 技术社区 · 4 年前

假设我有一个数据框

import pandas as pd
df = pd.DataFrame({'group':['A','A','B','B','C','C'],'score':[1,2,3,4,5,6]})

首先,我想计算各组的分数之和。我通常是这样的

def group_func(x):
    d = {}
    d['sum_scores'] = x['score'].sum()
    return pd.Series(d)
df.groupby('group').apply(group_func).reset_index()

现在假设我要修改 group_func 但这种修改要求我知道当前输入的组标识 x .我试过了 x['group'] 和 x[group].iloc[0] 在函数的定义范围内,两者都不起作用。

有什么方法可以实现这个功能吗 group_func(x) 了解当前输入的定义坐标 十、 ?

在这个玩具示例中,比方说,我只想得到:

pd.DataFrame({'group':['A','B','C'],'sum_scores':[3,7,11],'name_of_group':['A','B','C']})

很明显,最后一列只是重复第一列。我想知道如何使用 group\u func(x) .如:as group\u func 处理 十、 对应于组“A”,并生成值3 sum_scores ,如何在的本地范围内提取当前标识“A” group\u func ?

1 回复 | 直到 4 年前

BENY 4 年前

只需添加 .name

def group_func(x):
        d = {}
        d['sum_scores'] = x['score'].sum()
        d['group_name'] = x.name # d['group_name'] = x['group'].iloc[0] 
        return pd.Series(d)
    
df.groupby('group').apply(group_func)
Out[63]: 
       sum_scores group_name
group                       
A               3          A
B               7          B
C              11          C

您的代码修复请参见关于添加标记行 ''

推荐文章

TheCodeNovice · R中符号格式的尾随零和其他问题[重复]

1 年前

Daniel Estévez · 扩展数据帧以包含不存在的值

1 年前

T Richard · 根据条件交换分组数据中的字符串或值

1 年前

Homer Jay Simpson · R中flextable的标题字体和垂直合并

1 年前

RKIDEV · Panda迭代行并将第n行值乘以下一(n+1)行值

1 年前

Ssong · 如何有条件地运用资本化?

1 年前

Marcio Lino · 在Pandas中转换多个值列

1 年前

Ray · 在Python pandas包中使用groupby函数时,输出结果存在差异的原因是什么?

1 年前

RobertF · 如果列没有表头,如何在R数据帧中引用变量名?

1 年前

Homer Jay Simpson · ggplot2`geom_label()中的警告消息`

1 年前