代码之家 › 专栏 › 技术社区 › spore234

dplyr按字符串分组匹配

dplyr group-by r

spore234 · 技术社区 · 6 年前

df <- data.frame(v1 = c('jan1', 'jan2', 'jan3', 'jan4', 'feb1', 'feb2', 'mar1', 'mar2', 'mar3'),
             v2 = rnorm(9))

我想在对数据进行分组后对它们进行总结。我要把它们按数字分组 v1 ,即一组为(1月1日、2月1日、3月1日),另一组为(1月2日、2月2日、3月2日),依此类推。

我试过了,但没用:

df %>% group_by(str_detect(v1, '1')) %>% summarise(meanp = mean(v2),
                                 medianp = median(v2))

2 回复 | 直到 6 年前

markus 6 年前

我们能做到

library(dplyr)
df %>% 
  group_by(grp = gsub("\\D", "", v1)) %>% 
  summarise(mean_v2 = mean(v2)) # only for illustration
# A tibble: 4 x 2
#  grp   mean_v2
#  <chr>   <dbl>
#1 1      0.0635
#2 2      0.0338
#3 3     -0.130 
#4 4      1.60

这个 group_by 和 gsub v1 ,请参见 ?regex .

set.seed(1)
df <- data.frame(v1 = c('jan1', 'jan2', 'jan3', 'jan4', 'feb1', 'feb2', 'mar1', 'mar2', 'mar3'),
                 v2 = rnorm(9))

akrun 6 年前

str_remove

library(tidyverse)
df %>% 
  group_by(grp = str_remove(v1, "\\D+")) %>% 
  summarise(mean_v2 = mean(v2))
# A tibble: 4 x 2
#  grp   mean_v2
#  <chr>   <dbl>
#1 1      0.0635
#2 2      0.0338
#3 3     -0.130 
#4 4      1.60

推荐文章

Marc B. · 使用ggplot2创建条形图时“缺少值”

1 年前

deschen · tidyverse与外部向量发生突变,该外部向量的元素是数据帧中的列值

1 年前

Laura · 在Shiny中使用可排序的包拖放名称,这些名称将成为图表

1 年前

Mallikarjun M · 如何使用随机森林进行时间序列预测?

1 年前

ly li · 模型摘要:当表格形状改变时,拟合优度消失

1 年前

C.Robin · 将marginaffects::predictions()的结果连接回main df?

1 年前

monotonic · 如何将格式为“col1+col3+col4”的数据帧的行名转换为一列数字向量“c(1,3,4)”?

2 年前

Shawn Hemelstrand · 为什么我的自定义errorbar函数不能在R中工作?

2 年前

RoyBatty · 统计每个字符在整个数据集中出现的次数

2 年前

stats_noob · R: 记录某个“行为”发生的循环的索引?

2 年前