代码之家 › 专栏 › 技术社区 › Mark

删除重复行并对数据帧中最后一列的相应值求和

duplicates dataframe r

Mark · 技术社区 · 5 年前

如果我们想从数据帧中删除重复项 df ,我们只需要写 df[!duplicated(df),] 复制品将被删除。我有以下数据框:

df <- data.frame(from = c("z","y","z","w","y"), to=c("x","w","x","z","w"), weight=c(2,1,3,5,6))

我想得到一些不同的东西。在 df[,1:2] ,第一行和第三行之间是相等的,我想:1)删除其中一行;2)对相应的权重值求和。E、 g.对于本例,预期结果是:

   from to weight
     z  x      5
     y  w      7
     w  z      5

无论如何,如果我使用:

df2=df[,1:2]
which(duplicated(df2) | duplicated(df2[nrow(df2):1, ])[nrow(df2):1])

我得到

[1] 1 2 3 5

1 回复 | 直到 5 年前

akrun 5 年前

我们可以通过 sum 操作而不是 duplicated

aggregate(weight~ ., df, sum)

dplyr ,可以使用

library(dplyr)
df %>%
   group_by(from, to) %>%
   summarise(weight = sum(weight))

Hussain Ali 5 年前

推荐文章

TheCodeNovice · R中符号格式的尾随零和其他问题[重复]

6 月前

Daniel Estévez · 扩展数据帧以包含不存在的值

6 月前

T Richard · 根据条件交换分组数据中的字符串或值

6 月前

Homer Jay Simpson · R中flextable的标题字体和垂直合并

7 月前

RKIDEV · Panda迭代行并将第n行值乘以下一(n+1)行值

7 月前

Ssong · 如何有条件地运用资本化?

7 月前

Marcio Lino · 在Pandas中转换多个值列

7 月前

Ray · 在Python pandas包中使用groupby函数时,输出结果存在差异的原因是什么?

7 月前

RobertF · 如果列没有表头,如何在R数据帧中引用变量名?

7 月前

Homer Jay Simpson · ggplot2`geom_label()中的警告消息`

7 月前