代码之家  ›  专栏  ›  技术社区  ›  Mike S

从.HTML文件中剥离到[stringxyz]

  •  0
  • Mike S  · 技术社区  · 10 年前
    1. 我有包含表格的HTML文件。
    2. 我只想从文件中删除表格。
    3. 我对regex不太了解,也不知道如何查找/替换[stringxyz]之前的所有内容(这将离开页脚,但我想我可以稍后删除它)。
    4. 我尝试过[\s\s],但在TextCrawler3中似乎不起作用。

    提前感谢所有建议(包括不同的策略)。

    1 回复  |  直到 10 年前
        1
  •  1
  •   Shafizadeh    10 年前

    你在找这样的东西吗?

    电流输入:

    <b><i>some text and tag
    is hare</i></b>
    <table>
        <tr>
            <td>
                it is a row
            </td>
        </tr>
    </table>
    <p>some text else is here</p>
    

    预期产出:

    <b><i>some text and tag
    is hare</i></b> 
    <p>some text else is here</p>
    

    如果是,请尝试以下操作:

    /<table>[\s\S]+<\/table>/
    

    Online Demo