代码之家  ›  专栏  ›  技术社区  ›  AlphaScorpion

文本挖掘-查找以前缀开头的单词

  •  0
  • AlphaScorpion  · 技术社区  · 7 年前

    我有一个包含50000个“单元格”的专栏,其中包含段落。如果存在以“surv”开头的单词(如survive、survivor等),我想搜索每个“cell”如果存在,给我一个值=1,如果不存在,给我一个值=0。

    1 回复  |  直到 7 年前
        1
  •  4
  •   G5W    7 年前

    你可以用 grepl 还有一个正则表达式

    column = c("I survived the storm", "I surfed", 
        "Follow the curve", "The survival of the fittest")
    
    as.numeric(grepl("\\bsurv", column)) 
    [1] 1 0 0 1
    

    如果你还想捕捉“幸存者”,你可以添加 ignore.case = TRUE