代码之家 › 专栏 › 技术社区 › n179911

需要帮助重构我的python脚本

python

n179911 · 技术社区 · 15 年前

我有一个python脚本,它一行一行地处理一个文件,如果匹配一个regex,它调用一个函数来处理它。

我的问题是是否有更好的编写来重构我的脚本。这个脚本有效,但实际上,我需要将缩进保持在编辑器,因为我为我的文件添加了越来越多的regex。

谢谢你的建议。现在我的代码结束如下:

for line in fi.readlines():

       result= reg1.match(line)

       if result:
               handleReg1(result)

       else:
               result = reg2.match(line)

               if result:
                       handleReg2(result)
               else:
                       result = reg3.match(line)

                       if result:
                               handleReg3(result)
                       else:
                               result = reg4.match(line)

                               if result:
                                       handleReg4(result)
                               else:
                                       result = reg5.match(line)

                                       if result:
                                              handleReg5(result)

3 回复 | 直到 15 年前

samtregar 15 年前

我将切换到使用数据结构将regex映射到函数。类似:

map = { reg1: handleReg1, reg2: handleReg2, etc }

然后你只需循环它们:

for reg, handler in map.items():
    result = reg.match(line)
    if result:
       handler(result)
       break

如果您需要按照特定的顺序匹配,您需要使用列表而不是字典,但是主体是相同的。

ilya n. 15 年前

下面是一个小问题:

handlers = { reg1 : handleReg1, ... }

for line in fi.readlines():
    for h in handlers:
        x = h.match(line)
        if x:
            handlers[h](x)

如果有一行与多个regexp匹配,则此代码将与粘贴的代码不同:它将调用多个处理程序。添加 break 不会有帮助的,因为regexps将以不同的顺序进行尝试,所以您最终会调用错误的一个。因此,如果是这种情况,您应该遍历列表:

handlers = [ (reg1, handleReg1), (reg2, handleReg2), ... ]

for line in fi.readlines():
    for reg, handler in handlers:
        x = reg.match(line)
        if x:
            handler(x)
            break

Nelson 15 年前

另一种可能对您有用的方法是将所有regexp组合成一个巨大的regexp,并使用m.group()检测匹配的regexp。我的直觉说这应该更快,但我还没有测试过。

>>> reg = re.compile('(cat)|(dog)|(apple)')
>>> m = reg.search('we like dogs')
>>> print m.group()
dog
>>> print m.groups()
(None, 'dog', None)

如果要测试的regexp本身很复杂,或者使用匹配组,则情况会变得复杂。

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

3 月前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

4 月前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

4 月前

user29715306 · from_users=和chats=电视节目中的差异

4 月前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

4 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

4 月前

prayner · 更新嵌套字典包含列表中的项

4 月前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

4 月前

Dave · 如何在for循环中修改列表值

4 月前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

4 月前