代码之家 › 专栏 › 技术社区 › frank

每列中特定值的次数R

tidyverse r

frank · 技术社区 · 4 年前

我有:

library(tidyverse)
df <- tibble(one=c(1,1,1,2,2,2,3,3),
       log1 = c(TRUE, TRUE, FALSE, FALSE, FALSE, FALSE, TRUE, TRUE),
       log2 = c(TRUE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE),
       log3 = c(TRUE, TRUE, FALSE, FALSE, FALSE, FALSE, TRUE, FALSE))

我想找出单词“FALSE”在每个列和组中出现的次数,并返回一个df

我试过了 map_df(df, function(x) sum(x==FALSE)) 和

df %>%
  group_by(one) %>%
  map_df( function(x) sum(x==FALSE))

但他们不会分成不同的群体。

这也会出错

df %>%
  group_by(one) %>%
  summarise( function(x) sum(x==FALSE))

有什么建议吗?

1 回复 | 直到 4 年前

Andre Wildberg 4 年前

你可以用 across 要处理多个列

library(dplyr)

df %>% 
  group_by(one) %>% 
  summarise(across(starts_with("log"), function(x) sum(x==F)))
# A tibble: 3 Ã 4
    one  log1  log2  log3
  <dbl> <int> <int> <int>
1     1     1     1     1
2     2     3     3     3
3     3     0     2     1

一个简单的方法是直接使用布尔值,正如@RuiBarradas所提到的

...
summarise(across(starts_with("log"), function(x) sum(!x)))
...

推荐文章

geoscience123 · 如何计算R中一个表列与另一个数据帧的匹配数?

1 年前

Daniel Estévez · 扩展数据帧以包含不存在的值

1 年前

Sean · 创建列,在其他列中给出下一个相等或更小的值

1 年前

Pete · 通过将相应变量相乘并求和来创建新变量

1 年前

Evelyn Abbott · R: 根据另一个数据帧中列中的值范围分配列值

1 年前

arnyeinstein · 在mutate with paste中使用带有字符串的向量

1 年前

ThomasIsCoding · 使用dplyr根据外部列筛选数据

1 年前

bill999 · 如何创建显示观察值所处百分位数范围的变量

1 年前

Hydro · R中缺失月份的NA完整数据序列?

1 年前

Alex Holcombe · 为数据帧创建一个新的计算列,每行原始数据帧有多个值

1 年前