代码之家  ›  专栏  ›  技术社区  ›  GonzaloXavier

提取R中<option>标记的内容

  •  0
  • GonzaloXavier  · 技术社区  · 7 年前

    我正试图提取其中的文本 <option> 阻碍。

    我试过的是向后看,向前看。

    (?s)(?<=option value=\"\d).*?(?=<\/option)
    (?s)(?<=option value=\"[0-9]).*?(?=<\/option)
    

    然而,数值会发生变化,我不知道如何在一个lookback中捕获多个数字。

    例子:

    <option value="140">First string I wanna get</option> <option value="6070">Another string I want</option> <option value="20">This is interesting</option>

    1 回复  |  直到 7 年前
        1
  •  1
  •   Federico Piazza    7 年前

    我会将xpath与xpression一起使用,如 /option //option 取决于你需要什么。

    但是,如果您想使用正则表达式,则可以将正则表达式与捕捉组一起使用,如下所示:

    <option.*?>(.*?)</option>
    or
    <option[^>]+>(.*?)</option>
    

    Working demo