代码之家 › 专栏 › 技术社区 › ozo

熊猫-通过迭代过滤器计算平均值

numpy pandas python

ozo · 技术社区 · 7 年前

我有一个具有以下结构的数据帧

Goals   Team       Day
1     Madrid     monday  
3     Madrid     friday
3     Man U      monday
2     Man u      sunday
etc    etc       etc

所以我有一个包含数百个团队、一周中的几天和目标的数据框架。

我要做的是创建一个数据框架,其中包含团队和日期之间每个可能组合的平均值,例如:

Team     Day     Average
Madrid   monday    5.6
Madrid   tuesday   6.7
Madrid   tuesday   4.3
Madrid   wednesday 3.5
Madrid   thursday  4.3
Madrid   friday    3.9
Madrid   saturday  9.8
Madrid   sunday    3.4
Man U    monday    4.5
Man U    tuesday   4.2
...       ...      ...
etc       etc      etc

我怎么能用熊猫和麻木来做这个?

我想我必须使用循环,但我不知道怎么做。

1 回复 | 直到 7 年前

piRSquared 7 年前

安装程序

np.random.seed([3, 1415])

teams = ['Madrid', 'Man U']
days = 'mon tue wed thu fri sat sun'.split()
df = pd.DataFrame(dict(
    Team=np.random.choice(teams, 15),
    Day=np.random.choice(days, 15),
    Goals=np.random.randint(10, size=15)
))

`groupby`

df.groupby(
    ['Team', 'Day'], 
    as_index=False
).mean().rename(columns=dict(Goals='Average'))

     Team  Day  Average
0  Madrid  fri     8.00
1  Madrid  mon     3.75
2   Man U  mon     7.00
3   Man U  sat     5.00
4   Man U  sun     5.00
5   Man U  thu     7.00
6   Man U  tue     8.00
7   Man U  wed     4.00

解释

我希望 子句 不言自明
as_index=False 讲述 子句 不要将分组列放入结果的索引中。这使我不必 reset_index
mean() 取平均值
rename(columns=dict(Goals='Average')) 只是内务处理以获得所需的列名称。我把字典传给了 columns 论证 rename 方法。

对评论的回应

熊猫如何知道用哪一列来计算平均值?例如,如果我有两列有数值,我只想取其中一列的平均值,就会发生这种情况。我该怎么告诉熊猫?

您可以通过在 子句

df.groupby(
    ['Team', 'Day'], 
    as_index=False
).Goals.mean().rename(columns=dict(Goals='Average'))

否则,熊猫将尝试平均所有未分组的列。

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

7 月前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

7 月前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

7 月前

user29715306 · from_users=和chats=电视节目中的差异

7 月前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

7 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

7 月前

prayner · 更新嵌套字典包含列表中的项

7 月前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

7 月前

Dave · 如何在for循环中修改列表值

7 月前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

7 月前