代码之家 › 专栏 › 技术社区 › 5th

无硬编码的双排列

5th · 技术社区 · 7 年前

我被困在这里。我试过用 spread 两次从 tidyr ,我试着加入。但是,如果没有一些硬编码,这些方法都不能给出正确的解决方案。

是否有任何方法可以转换此数据:

    cat1   cat2 title
1      A      G    AB
2      B      G    BC
3      C      B    CD
4      D      G    DE
5      E      H    EF
6      F      A    FG

在这方面:

   A B C D E F G H
AB 1 0 0 0 0 0 1 0
BC 0 1 0 0 0 0 1 0
CD 0 1 1 0 0 0 0 0
DE 0 0 0 1 0 0 1 0
EF 0 0 0 0 1 0 0 1
FG 1 0 0 0 0 1 0 0

样本数据:

df<-data.frame(cat1=LETTERS[1:6],
               cat2=c('G','G','B','G','H','A'),
               title=paste0(LETTERS[1:6],LETTERS[2:7]))

因为我通常 dplyr 回答更快:R基或 蒂迪尔 只有解决方案也非常受欢迎

2 回复 | 直到 7 年前

MHammer 7 年前

我不知道这是否可以作为操作的硬编码

df %>% 
  tidyr::gather(key = vars, value = values, cat1, cat2) %>% 
  dplyr::mutate(vars = 1) %>% 
  tidyr::spread(key = values, value = vars, fill = 0)
#   title A B C D E F G H
# 1    AB 1 0 0 0 0 0 1 0
# 2    BC 0 1 0 0 0 0 1 0
# 3    CD 0 1 1 0 0 0 0 0
# 4    DE 0 0 0 1 0 0 1 0
# 5    EF 0 0 0 0 1 0 0 1
# 6    FG 1 0 0 0 0 1 0 0

Mako212 7 年前

只是 melt 首先,然后铸造:

require(reshape2)

melt(df, id="title") %>% dcast(title ~ value, length)

  title A B C D E F G H
1    AB 1 0 0 0 0 0 1 0
2    BC 0 1 0 0 0 0 1 0
3    CD 0 1 1 0 0 0 0 0
4    DE 0 0 0 1 0 0 1 0
5    EF 0 0 0 0 1 0 0 1
6    FG 1 0 0 0 0 1 0 0

熔化

推荐文章

Amp · 使用R ggplot2删除geom_radial中axis.line和panel.border之间的空格

6 月前

Hard_Course · 用另一列中的值替换行的最后一个非NA条目

7 月前

Mark R · 使用geom_sf()删除地球仪上不需要的网格线

7 月前

Joe · 根据对工作日和本周早些时候的日期的了解,找到一个日期

7 月前

Ben · 统计向量中的单词在字符串中出现的频率

7 月前

TheCodeNovice · R中符号格式的尾随零和其他问题[重复]

7 月前

katefull06 · 在R中使用terra修改范围时,会为单独的SpatRaster重写范围

7 月前

dez93_2000 · 在R管道子功能中引用管道对象的当前状态

7 月前

accibio · 在ggplot2中为同一变量创建两个连续的颜色渐变比例

7 月前

Mankka · 如何在Ggplot2中绘制均匀的径向图

7 月前