代码之家 › 专栏 › 技术社区 › Cory Nezin

为什么Regex(C++)取指数时间?

clock time-complexity regex c++

Cory Nezin · 技术社区 · 7 年前

我正在做一些教科书中的regex问题,其中包括:

“[匹配]所有以整数开头、以单词结尾的字符串。”

为此,我编写了以下正则表达式:

^[0-9]+\s.*+\b[a-zA-Z]+$

但是,当我在C++中用下面的代码实现这一点时:

#include <iostream>
#include <string>
#include <regex>
#include <time.h>

int main(){
    clock_t t;
    bool match;
    std::string exp = "^[0-9]+\\s.*+\b[a-zA-Z]+$";
    std::string str = "1 a few words 1";
    std::string s (str);
    std::smatch m;
    std::regex e (exp);
    while (true){
        t = clock();
        match = std::regex_match(s, m, e); 
        s = s + "1";
        std::cout << clock() - t << std::endl;
    }   
}

每次迭代所用的CPU时间为:

看起来很复杂 O( 3^n )

为什么会这样?这个表达有什么我做错的吗?

如果我使用类似“1 a 1”的字符串,但使用较小的常量,则增长因子是相同的。

编辑:我看到的问题是我有一个 .*+ 哎呀!不过,我不知道这为什么会导致指数行为。

2 回复 | 直到 7 年前

Jerry Coffin 7 年前

.*+\b .*\\b

.* +

\b

sweting 7 年前

推荐文章

AstralHex · 矩阵乘法代码工作不正常

7 月前

Baba Dan Constantin · SSE4.1在矩阵4x4乘法上比SSE3慢?

7 月前

Giogre · 为包含许多数值字段的简单“struct”重载比较运算符

7 月前

einpoklum · 定义一个并不真正提供now()函数的std::chrono Clock是“合法的”吗?

7 月前

Fishie · 作为类成员的智能指针是否仍然自动释放?[关闭]

7 月前

Die4Toast · 递归调用成员箭头运算符->

7 月前

Angle.Bracket · 如何用C++将UTF-8文件名写入MS Windows控制台?

7 月前

Anka HanÄ±m · 关于结构和动态数组地址的问题

7 月前

Adam Barnes · 我如何定义一个基于constexpr函数返回值进行限制的概念?

7 月前

user2138149 · 为什么我不能获取包含多个元素的结构体中某些元素的地址?[副本]

7 月前