代码之家 › 专栏 › 技术社区 › st_dec

使用正则表达式[复制]提取日期

date regex python

st_dec · 技术社区 · 5 年前

如果我这样做,我如何访问捕获的组 findall(r'regex(with)capturing.goes.here') ? 我知道我能做到 finditer ,但我不想重复。

0 回复 | 直到 15 年前

116

Eli Bendersky 15 年前

findall 只返回捕获的组:

>>> re.findall('abc(de)fg(123)', 'abcdefg123 and again abcdefg123')
[('de', '123'), ('de', '123')]

相关文件摘录:

返回以下所有不重叠的匹配项字符串中的模式,作为列表串。字符串已被扫描从左到右,比赛是按照找到的顺序返回。如果一个或更多的组存在于 pattern,返回组列表;这如果满足以下条件,则将是一个元组列表模式有多个组。空比赛结果中包括除非他们触及了开始另一场比赛。

bluepnume 15 年前

自由使用群组。匹配结果将以组元组列表的形式返回:

>>> re.findall('(1(23))45', '12345')
[('123', '23')]

如果你想包含完整的匹配项,只需将整个正则表达式括在一个组中:

>>> re.findall('(1(23)45)', '12345')
[('12345', '23')]

Mona Jalal 10 年前

import re
string = 'Perotto, Pier Giorgio'
names = re.findall(r'''
                 (?P<first>[-\w ]+),\s #first name
                 (?P<last> [-\w ]+) #last name
                 ''',string, re.X|re.M)

print(names)

退货

[('Perotto', 'Pier Giorgio')]

re.M 如果你的字符串是多行的,这是有道理的。你还需要 VERBOSE (等于 re.X )我编写的正则表达式中的模式是因为它使用 '''

Tim Pietzcker 15 年前

有几种可能的方法:

>>> import re
>>> r = re.compile(r"'(\d+)'")
>>> result = r.findall("'1', '2', '345'")
>>> result
['1', '2', '345']
>>> result[0]
'1'
>>> for item in result:
...     print(item)
...
1
2
345
>>>

推荐文章

DotFX · RegEx捕获关键字前但括号后的所有内容

1 年前

user66001 · 正则表达式用于匹配有引号和无引号的文本,并且不匹配任何部分

1 年前

perlchamp · 为什么这也匹配?

1 年前

con · Negative Lookaward在perl正则表达式中不起作用

1 年前

Andrus · 如何在sql中查找第二个匹配项

1 年前

iato · 确保正则表达式不从命名材料中的数字中提取

1 年前

vr8ce · 非成对标记中特定字符的正则表达式

1 年前

MARTIN · 交换第一个和最后一个单词,反转所有中间的字符

1 年前

Carsten · 使用最近的搜索模式更改文本块

1 年前

Eric Marceau · Grep:有没有一种特殊的方法可以将“无字符”作为“字符位置”匹配的置换?

1 年前