代码之家 › 专栏 › 技术社区 › WalliYo_

使用stringr::word获取除撇号外的特殊字符前的字符串

stringr tidyverse r

WalliYo_ · 技术社区 · 9 月前

字符串:

text="Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte/question et ne vous a pas orientÃ© ailleurs"

我想提取“/”之前的部分。我试过了

word(text,sep="[[:punct:]]")
[1] "Il n"

在我的情况下,问题在于我有很多字符串,每个字符串都有不同的特殊字符。考虑到上面的例子,特殊字符是“/”,但也可以是“,”或“;”或“(”等。因此,我正在寻找一个全局解决方案。

1 回复 | 直到 9 月前

Konrad Rudolph 9 月前

您的代码正在使用任何标点符号作为分隔符,以及 â 可作为标点符号。如果你想限制类别,可以将备选列表硬编码为字符类(例如。 [/,;(] )或者使用否定的前瞻来匹配所有标点符号除了撇号等。

这是排除撇号的否定前瞻的解决方案。您可以根据需要添加其他字符;但是,请注意,撇号和(英语)单引号之间没有区别,至少在字符级别上没有区别。

word(text, sep = '(?!â)[[:punct:]]')
# [1] "Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte"

jkd 9 月前

您可以将多个分隔符指定为向量、正则表达式列表,或者将它们与 | .

texts=c("Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte/question et ne vous a pas orientÃ© ailleurs",
        "Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte; question et ne vous a pas orientÃ© ailleurs",
        "Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte (question et ne vous a pas orientÃ© ailleurs)")

word(texts,sep=c("/",";","\\("))
# [1] "Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte"  "Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte" 
# [3] "Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte "

word(texts,sep="[/;\\(]")
# [1] "Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte"  "Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte" 
# [3] "Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte "

word(texts,sep="/|;|\\(")
# [1] "Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte"  "Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte" 
# [3] "Il nâa pas rÃ©ussi Ã  rÃ©pondre Ã  votre plainte "

请注意,作为特殊正则表达式字符的分隔符(例如,!、(、{、…)必须用转义符转义 \\ .

推荐文章

monotonic · 如何将格式为“col1+col3+col4”的数据帧的行名转换为一列数字向量“c(1,3,4)”?

2 年前

RoyBatty · 统计每个字符在整个数据集中出现的次数

2 年前

Sebastian · 用多重性别特定年龄组旋转人口数据

2 年前

John Thomas · 使用tidyverse/dplyr[duplicate]创建虚拟变量作为计数

2 年前

John Thomas · 将ID的所有条目存储在tidyverse中列内的列表中

2 年前

George carrick · 如何在R中检测时间序列数据中的缺失年份?

2 年前

anderwyang · 在r/dplyr中,如何根据现有变量批量添加新变量

2 年前

MCP_infiltrator · 在“tible”中添加一列,给出其列表位置

2 年前

HoelR · 每N列将数据帧拆分为多个

2 年前

Cmagelssen · 从R中的列表中提取索引值?

3 年前