代码之家 › 专栏 › 技术社区 › jakes

向数据帧添加中间观测值(手动插值)

purrr tidyverse dplyr dataframe r

jakes · 技术社区 · 7 年前

我有一个数据框,如下图所示,带有向量坐标:

df <- structure(list(x0 = c(22.6, 38.5, 73.7), y0 = c(62.9, 56.6, 27.7
), x1 = c(45.8, 49.3, 80.8), y1 = c(69.9, 21.9, 14)), row.names = c(NA, 
-3L), class = c("tbl_df", "tbl", "data.frame"))
# A tibble: 3 x 4
     x0    y0    x1    y1
  <dbl> <dbl> <dbl> <dbl>
1  22.6  62.9  45.8  69.9
2  38.5  56.6  49.3  21.9
3  73.7  27.7  80.8  14

出于可视化目的,我需要手动插值点,即在每两行数据之间添加一个中间行 df ,起始坐标在哪里 x0, y0 是原始上一行的结束坐标,而结束坐标 x1, y1 是原始的下一行的起始坐标。如果观察结果来自原始数据集或是手动添加的,我还需要保留信息。因此,预期的产出将是:

# A tibble: 5 x 5
      x     y pass_end_x pass_end_y source  
  <dbl> <dbl>      <dbl>      <dbl> <chr>   
1  22.6  62.9       45.8       69.9 original
2  45.8  69.9       38.5       56.6 added   
3  38.5  56.6       49.3       21.9 original
4  49.3  21.9       73.7       27.7 added   
5  73.7  27.7       80.8       14   original

我怎样才能高效优雅地做到这一点(最好是在 tidyverse )?

1 回复 | 直到 7 年前

Mako212 7 年前

为此,我要做的就是交换起点和终点的列名,然后使用 lead 以获取的下一个值 x1 和 y1 .然后我们只需添加 source 标签,和 bind_rows

library(tidyverse)

df2 <- df

names(df2) <- names(df2)[c(3,4,1,2)] # swap names

df2 <- df2 %>% mutate(x1 = lead(x1), y1 = lead(y1),source = "added")

df <- df %>% mutate(source = "original") %>% bind_rows(., df2)

导致:

# A tibble: 6 x 5
     x0    y0    x1    y1 source  
  <dbl> <dbl> <dbl> <dbl> <chr>   
1  22.6  62.9  45.8  69.9 original
2  38.5  56.6  49.3  21.9 original
3  73.7  27.7  80.8  14   original
4  45.8  69.9  38.5  56.6 added   
5  49.3  21.9  73.7  27.7 added   
6  80.8  14    NA    NA   added

如果需要按顺序排列这些行:

df2 <- df2 %>% mutate(x1 = lead(x1), y1 = lead(y1),source = "added", ID = seq(1,n()*2, by =2)+1)

df <- df %>% mutate(source = "original", ID = seq(1,n()*2, by =2)) %>% bind_rows(., df2) %>% arrange(ID)

# A tibble: 6 x 6
     x0    y0    x1    y1 source      ID
  <dbl> <dbl> <dbl> <dbl> <chr>    <dbl>
1  22.6  62.9  45.8  69.9 original     1
2  45.8  69.9  38.5  56.6 added        2
3  38.5  56.6  49.3  21.9 original     3
4  49.3  21.9  73.7  27.7 added        4
5  73.7  27.7  80.8  14   original     5
6  80.8  14    NA    NA   added        6

推荐文章

MCP_infiltrator · 在“tible”中添加一列,给出其列表位置

3 年前

sbac · 如何对R中数据帧的几列应用统计测试

4 年前

John-Henry · 使用“purrr::map”将“lm”对象循环到“broom::tidy”`

4 年前

deschen · 将列乘以向量的tidyverse解决方案

4 年前

Nuller · 无法对嵌套数据中的列进行子集设置。框架

4 年前

chrischi · R Purrr-系数最高

7 年前

Richard Herron · 从purr的pmap()调用var()返回NA

8 年前

Davide Lorino · 嵌套数据帧上的函数向量算法

8 年前

âÊÊá¸á¸½á¸ · 如何使用purrr从两个元素的列表中提取元素?

8 年前

andrew_reece · map\u dfr:填充。具有字符串标签的id列,而不是没有字符串标签的索引。x已命名

8 年前