代码之家 › 专栏 › 技术社区 › spitfiredd

熊猫:分组加权平均,如何控制输出列的名称?

pandas python

spitfiredd · 技术社区 · 6 年前

我正在使用一个自定义函数来计算加权平均值。

就像,

df.groupby(['group1', 'group2']).apply(weighted_average, 'val', 'wt')

回归系列是这样的,

group1                group2
foo                   a              8.085493
                      b             45.610411
                      c            161.959249
                      d             85.923614
                      e             30.953251
Abar                  a             24.000000
                      b             11.000000
                      c             18.723185

但是,加权平均列没有名称。如何显式命名此列?

我不想依赖这样一个事实:列被指定了名称 0 因为那可能会导致失败。

2 回复 | 直到 6 年前

harvpan 6 年前

使用安装程序 @user3483203 的答案,你可以使用 reset_index() 具有 name .

df = pd.DataFrame({'a': [1,1,2,2,3,3], 'b': [1,2,3,4,5,6], 'c': [1,4,3,2,1,6]})
df.groupby(['a', 'b']).c.mean().reset_index(name='avg')

输出:

   a    b   avg
0   1   1   1
1   1   2   4
2   2   3   3
3   2   4   2
4   3   5   1
5   3   6   6

user3483203 6 年前

使用 pd.Series.rename 和 reset_index :

df = pd.DataFrame({'a': [1,1,2,2,3,3], 'b': [1,2,3,4,5,6], 'c': [1,4,3,2,1,6]})
df.groupby(['a', 'b']).c.mean()

a  b
1  1    1
   2    4
2  3    3
   4    2
3  5    1
   6    6

使用 rename

df.groupby(['a', 'b']).c.mean().rename('hello').reset_index()

   a  b  hello
0  1  1      1
1  1  2      4
2  2  3      3
3  2  4      2
4  3  5      1
5  3  6      6

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

3 月前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

4 月前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

4 月前

user29715306 · from_users=和chats=电视节目中的差异

4 月前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

4 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

4 月前

prayner · 更新嵌套字典包含列表中的项

4 月前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

4 月前

Dave · 如何在for循环中修改列表值

4 月前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

4 月前