代码之家 › 专栏 › 技术社区 › leoluk

多行regex替换

regex python

leoluk · 技术社区 · 15 年前

我想将文本转换为:

$$
foo
bar
$$

到

<% tex
foo
bar
%>

和 $\alpha$ 到 <% tex \alpha %> .

对于单线替换,我执行了以下操作:

re.sub(r"\$(.*)\$", r"<% tex \1 %>", text)

…而且效果很好。

现在,我添加了多行标志来捕获多行标志:

re.sub(r"(?i)\$\$(.*)\$\$", r"<% tex \1 %>", text)

…但它返回:

<% tex  %>
foo
bar
<% tex  %>

为什么?我相信这是微不足道的,但我无法想象。

2 回复 | 直到 7 年前

Ryan Ginstrom 15 年前

我建议你使用re.m(多行)标志,把你捕获的所有东西都吃光,而不是一个美元符号。

>>> import re
>>> t = """$$
foo
bar
$$"""
>>> re.sub(r"\$\$([^\$]+)\$\$", r"<% tex \1 %>", t, re.M)
'<% tex \nfoo\nbar\n %>'

juan cortez 7 年前

使用python 2.7.12 我已经证实这是可行的:

>>> import re
>>> t = """$$
... foo
... bar
... $$"""
>>> re.sub(r"\$\$(.*?)\$\$", r"<% tex \1 %>", t, flags=re.DOTALL)
'<% tex \nfoo\nbar\n %>'

对于Dotall标志,根据官方文件:

R.S

关于.dotall

使“.”特殊字符与中的任何字符匹配全部,包括换行符;如果没有此标志,“”将匹配任何内容除了换行。

推荐文章

DotFX · RegEx捕获关键字前但括号后的所有内容

1 年前

user66001 · 正则表达式用于匹配有引号和无引号的文本,并且不匹配任何部分

1 年前

perlchamp · 为什么这也匹配?

1 年前

con · Negative Lookaward在perl正则表达式中不起作用

1 年前

Andrus · 如何在sql中查找第二个匹配项

1 年前

iato · 确保正则表达式不从命名材料中的数字中提取

1 年前

vr8ce · 非成对标记中特定字符的正则表达式

1 年前

MARTIN · 交换第一个和最后一个单词,反转所有中间的字符

1 年前

Carsten · 使用最近的搜索模式更改文本块

1 年前

Eric Marceau · Grep:有没有一种特殊的方法可以将“无字符”作为“字符位置”匹配的置换?

1 年前