代码之家 › 专栏 › 技术社区 › user3570187

添加带有mutate和group by的新列

tidyr plyr dplyr r

user3570187 · 技术社区 · 7 年前

我想基于前一列和GroupBy函数创建一个名为Age的新列。数据集如下:

tid<- c(1,2,3,4, 1,2,3,4,1,2,3,4)
active<- c(0,1,0,4, 0,0,0,1,0,0,1,0)
person<- c('John', 'John','John', 'John', 'Emma', 'Emma','Emma','Emma', 'Edward', 'Edward', 'Edward', 'Edward')
df<- data.frame(tid, active, person)

我想创建一个从0开始的年龄,当这个人第一次活动时,也就是说,活动的值第一次大于0,然后以一个值递增地添加到下一个记录中。有什么建议吗?

我预计产量如下:

 name     age 
 John     0
 John     0
 John     1
 John     2
 Emma     0
 Emma     0
 Emma     0
 Emma     0
 Edward   0
 Edward   0
 Edward   0
 Edward   1

2 回复 | 直到 7 年前

davsjob 7 年前

这能帮你解决问题吗?

library(dplyr)

df %>% 
  group_by(person) %>% 
  arrange(person, tid) %>%
  mutate(active_dummy = if_else(lag(cumsum(active)) > 0, 1, 0, 0),
         age = cumsum(active_dummy)) %>% 
  select(person, age)

给你

# A tibble: 12 x 2
# Groups:   person [3]
   person   age
   <chr>  <dbl>
 1 John      0.
 2 John      0.
 3 John      1.
 4 John      2.
 5 Emma      0.
 6 Emma      0.
 7 Emma      0.
 8 Emma      0.
 9 Edward    0.
10 Edward    0.
11 Edward    0.
12 Edward    1.

vectorson 7 年前

另一种解决方案也能完成这项工作:

library(tidyverse)

age_counter = df %>% 
    arrange(tid) %>%
    group_by(person) %>% 
    filter(cumsum(active) > 0) %>% 
    mutate(age = row_number() - 1)

df %>% 
    left_join(age_counter) %>%
    replace_na(list(age = 0)) %>%
    select(person, age)

推荐文章

Amp · 使用R ggplot2删除geom_radial中axis.line和panel.border之间的空格

11 月前

Hard_Course · 用另一列中的值替换行的最后一个非NA条目

11 月前

Mark R · 使用geom_sf()删除地球仪上不需要的网格线

11 月前

Joe · 根据对工作日和本周早些时候的日期的了解,找到一个日期

11 月前

Ben · 统计向量中的单词在字符串中出现的频率

11 月前

TheCodeNovice · R中符号格式的尾随零和其他问题[重复]

11 月前

katefull06 · 在R中使用terra修改范围时,会为单独的SpatRaster重写范围

11 月前

dez93_2000 · 在R管道子功能中引用管道对象的当前状态

11 月前

accibio · 在ggplot2中为同一变量创建两个连续的颜色渐变比例

12 月前

Mankka · 如何在Ggplot2中绘制均匀的径向图

12 月前