代码之家 › 专栏 › 技术社区 › kiwi_kimchi

根据N列的值计算行数

count group-by numpy pandas python

kiwi_kimchi · 技术社区 · 2 年前

我有一个数据集,如下所示:

Col1    Col2    Col3
A        100     100
A         0       0
A         0      100
B        100      0
C        100     100
C        100     100

我想根据 A B 和 C

这将导致:

    Col2_counts   Col3_counts
A       1           2
B       1           0
C       2           2

这样我就可以计算出 A B C 在里面 Col2 和 Col3 等

我试过了 df.groupby(['Col1', 'Col 2', 'Col3']).transform ('count') ,但它并没有给我想要的结果。

1 回复 | 直到 2 年前

Panda Kim 2 年前

df.set_index('Col1').gt(0).groupby(level=0).sum()

输出:

        Col2    Col3
Col1        
A       1       2
B       1       0
C       2       2

Lonbot 2 年前

以下块将生成您的预期输出:

(
    df
    .set_index("Col1")
    .eq(100)
    .groupby("Col1")
    .sum()
    .add_suffix("_counts")
)

正如chrslg所指出的,Panda Kim的回答评估了rows>0而不是行==100。此外,您可以添加 "_counts" 后缀,以获取示例中的列名。

以下是每个操作的分步说明:

评估单元格是否相等( eq )至100。

      Col2    Col3
Col1        
A     True    True
A     False   False
A     False   True
B     True    False
C     True    True
C     True    True

添加 “计数(_co)” 所有列的后缀。

      Col2_counts   Col3_counts
Col1        
A         1              2
B         1              0
C         2              2

推荐文章

Homer Jay Simpson · 添加列出现次数

1 年前

Tez · 数据帧-统计三列中具有相似(相同)变量的变量的频率

1 年前

swat · 在同一列上选择SQL语句

1 年前

Lisa · 如何使用Python找到一个表中哪些标记行位于或高于另一个表的某些点?

1 年前

Giampaolo Levorato · 计数Pandas列表中的连续元素

1 年前

Elijah · 计算与其他列值关联的列中的值集[重复]

1 年前

Chulho Chang · 计算一行中特定字符的数量(不在范围内)

1 年前

Clark Hung · 如果主类别相同,如何统计所有子类别,但只统计一次

2 年前

Rajesh Ahir · 如何在pandas数据帧的列中找到连续的null(NaN)?

2 年前

TarJae · 如何在一次运行中对多个列计数使用计数

2 年前