代码之家 › 专栏 › 技术社区 › JasonAizkalns

基于一个或多个单词后跟两个数值的regex将字符串拆分为多行

regex r

JasonAizkalns · 技术社区 · 7 年前

给出这样的字符串:

x <- c("Carroll 103 215 Albany City 24 41 Allegany 115 231 Charlotte 116 248")

把它分成这样的行最好的方法是什么:

# [1] Carroll 103 215
# [2] Albany City 24 41
# [3] Allegany 115 231
# [4] Charlotte 116 248

是“奥尔巴尼城”给我带来了麻烦。还有其他单词也将包含一个或多个单词(例如“port jervis city”),但是,这些单词后面应该始终跟长度为1或更多的数值。

2 回复 | 直到 7 年前

Andre Elrico 7 年前

你可以使用 ?strsplit 从正常R

strsplit(x, "(?<=\\d)\\s(?=[A-Za-z])", perl = T)[[1]]

或

strsplit(x, "(?<=\\d)\\s(?=\\D)", perl = T)[[1]] # less explizit, but much cooler

对于两者

#[1] "Carroll 103 215"   "Albany City 24 41" "Allegany 115 231"  "Charlotte 116 248"

数据:

x = "Carroll 103 215 Albany City 24 41 Allegany 115 231 Charlotte 116 248"

了解更多?:

mrzasa 7 年前

你可以使用 str_extract_all 在带有regex的字符串中查找所有regex匹配项:

[A-Za-z ]+(\s\d+)+\s?

说明:

推荐文章

Amp · 使用R ggplot2删除geom_radial中axis.line和panel.border之间的空格

1 年前

Hard_Course · 用另一列中的值替换行的最后一个非NA条目

1 年前

Mark R · 使用geom_sf()删除地球仪上不需要的网格线

1 年前

Joe · 根据对工作日和本周早些时候的日期的了解,找到一个日期

1 年前

Ben · 统计向量中的单词在字符串中出现的频率

1 年前

TheCodeNovice · R中符号格式的尾随零和其他问题[重复]

1 年前

katefull06 · 在R中使用terra修改范围时,会为单独的SpatRaster重写范围

1 年前

dez93_2000 · 在R管道子功能中引用管道对象的当前状态

1 年前

accibio · 在ggplot2中为同一变量创建两个连续的颜色渐变比例

1 年前

Mankka · 如何在Ggplot2中绘制均匀的径向图

1 年前