代码之家 › 专栏 › 技术社区 › buhtz

删除列表中的行数据框出现在另一个数据框按rowname()作为id

buhtz · 技术社区 · 7 年前

我知道有一些类似的问题。但他们的答案对我的情况没有帮助,或者我理解错了。

set.seed(0)

df <- data.frame(A = seq(20),
                 B1 = sample(c(T, F), 20, replace=T),
                 B2 = sample(c(T, F), 20, replace=T))

rownames(df) <- df$A
df <- df[, c('B1', 'B2'), drop = FALSE]

result <- df[df$B1 == FALSE & df$B2 == FALSE, ]

print(result)

结果是

> result
      B1    B2
1  FALSE FALSE
4  FALSE FALSE
10 FALSE FALSE
16 FALSE FALSE
18 FALSE FALSE

df 没有 rownames() 或命名行。所以有名字的行 1, 4, 10, 16, 18 应在不导致其他行重命名的情况下删除。

我的尝试(基于其他答案):

> library(dplyr)
> anti_join(df, result)
Joining, by = c("B1", "B2")
      B1    B2
1   TRUE FALSE
2   TRUE  TRUE
3  FALSE  TRUE
4   TRUE  TRUE
5  FALSE  TRUE
6  FALSE  TRUE
7  FALSE  TRUE
8   TRUE  TRUE
9   TRUE  TRUE
10  TRUE FALSE
11 FALSE  TRUE
12  TRUE  TRUE
13  TRUE FALSE
14 FALSE  TRUE
15  TRUE FALSE

这里的行名不正确。它们只是从1到15。

> setdiff(df, result)
     B1    B2
1  TRUE FALSE
2  TRUE  TRUE
3 FALSE  TRUE

2 回复 | 直到 7 年前

Ronak Shah 7 年前

一个带有 setdiff 可能是:

df[setdiff(rownames(df), rownames(result)), ]

#      B1    B2
#2   TRUE FALSE
#3   TRUE  TRUE
#5  FALSE  TRUE
#6   TRUE  TRUE
#7  FALSE  TRUE
#8  FALSE  TRUE
#9  FALSE  TRUE
#11  TRUE  TRUE
#12  TRUE  TRUE
#13  TRUE FALSE
#14 FALSE  TRUE
#15  TRUE  TRUE
#17  TRUE FALSE
#19 FALSE  TRUE
#20  TRUE FALSE

然而,我建议的一种更普遍的方法是只计算一次指数并使用它们。

inds <- df$B1 == FALSE & df$B2 == FALSE
result <- df[inds, ]
output <- df[!inds, ]

akrun 7 年前

我们可以用 %in% 具有 !

df[!rownames(df) %in% rownames(result),]

推荐文章

Amp · 使用R ggplot2删除geom_radial中axis.line和panel.border之间的空格

1 年前

Hard_Course · 用另一列中的值替换行的最后一个非NA条目

1 年前

Mark R · 使用geom_sf()删除地球仪上不需要的网格线

1 年前

Joe · 根据对工作日和本周早些时候的日期的了解,找到一个日期

1 年前

Ben · 统计向量中的单词在字符串中出现的频率

1 年前

TheCodeNovice · R中符号格式的尾随零和其他问题[重复]

1 年前

katefull06 · 在R中使用terra修改范围时,会为单独的SpatRaster重写范围

1 年前

dez93_2000 · 在R管道子功能中引用管道对象的当前状态

1 年前

accibio · 在ggplot2中为同一变量创建两个连续的颜色渐变比例

1 年前

Mankka · 如何在Ggplot2中绘制均匀的径向图

1 年前