代码之家 › 专栏 › 技术社区 › maycca

R:从数据帧列表中选择列,而有些列在少数数据帧中不存在。

maycca · 技术社区 · 6 年前

我有一个数据帧列表,它只有几个共同的列。我有一个我想要保留的列向量。但是,有些数据帧正好有这些列,有些则缺少一些列。

如果每个数据帧都包含相同的列,我只需使用 subset(df, select = c("column", "names")) 选择我感兴趣的列。但是,如何只选择存在的列呢?

我有一个虚拟的例子,但我想用 map 或 lapply 函数在列表中,因为我的实际数据中有许多数据帧。

我的虚拟例子:

df1<- data.frame(a  = seq(0,5),
                 b  = seq(5,10),
                 cc = seq(10,15))

df2<- data.frame(a  = seq(0,5),
                 b  = seq(5,10),
                 d = seq(10,15))


ls <-list(df1, df2)

# select columns,  "cc" column is missing from df2
keep<-c("b", "cc")

如何修改此函数以仅选择数据帧中存在的列?

lapply(ls, function(x) subset(x, select = keep) )

列号不均匀的预期输出:

1 回复 | 直到 6 年前

MRau 6 年前

你可以使用 intersect 功能:

> intersect(c("a", "b", "c"), c("a", "b"))
[1] "a" "b"

也就是说,像这样修改您的函数:

> lapply(ls, function(x) subset(x, select = intersect(keep, colnames(x))))
[[1]]
   b cc
1  5 10
2  6 11
3  7 12
4  8 13
5  9 14
6 10 15

[[2]]
   b
1  5
2  6
3  7
4  8
5  9
6 10

推荐文章

Amp · 使用R ggplot2删除geom_radial中axis.line和panel.border之间的空格

7 月前

Hard_Course · 用另一列中的值替换行的最后一个非NA条目

7 月前

Mark R · 使用geom_sf()删除地球仪上不需要的网格线

7 月前

Joe · 根据对工作日和本周早些时候的日期的了解,找到一个日期

7 月前

Ben · 统计向量中的单词在字符串中出现的频率

7 月前

TheCodeNovice · R中符号格式的尾随零和其他问题[重复]

7 月前

katefull06 · 在R中使用terra修改范围时,会为单独的SpatRaster重写范围

7 月前

dez93_2000 · 在R管道子功能中引用管道对象的当前状态

7 月前

accibio · 在ggplot2中为同一变量创建两个连续的颜色渐变比例

7 月前

Mankka · 如何在Ggplot2中绘制均匀的径向图

7 月前