代码之家 › 专栏 › 技术社区 › Kieron

性能不佳的regex

performance regex javascript

Kieron · 技术社区 · 16 年前

我有一个非常糟糕的regex,目前它使firefox,chrome和ie挂一段时间。

这是注册前:

 ^([a-zA-Z0-9]+[/]?)+[a-zA-Z0-9]+$

这是一种URL匹配器,但应该只匹配请求的路径(不以斜线开头或结尾)。

有效实例:

无效示例:

在所有三个浏览器上使用上面的regex,并使用两个或多个斜杠会导致浏览器挂起。

这显然是一个不良的注册前,但谁能帮助建立一个更好的?

谢谢,

3 回复 | 直到 16 年前

Welbog 16 年前

一个更好的方法是更具确定性,并且不捕获组:

^[a-zA-Z0-9]+(?:/[a-zA-Z0-9]+)*$

这样你就不会有重叠的群体,也不会不必要地捕捉事物。

Alex Martelli 16 年前

我认为问题在于,有了选修课 / 字符串可以用太多的方式解析,特别是N个字母的任何序列都可以用N-1方式匹配。如何:

^([a-zA-Z0-9]+[/])*[a-zA-Z0-9]+$

即0或更多(1+字母,然后斜线),然后是(1+字母)的最后一个帮助。(当然,正如其他答案所提到的,你可以也放一个 ?: 如果您希望组不被捕获,则在打开paren之后。

YOU 16 年前

尝试

^(?:[^/]+/)*[^/]+$

或如果 [a-zA-Z0-9]+ 真的很有必要,试试看

^(?:[a-zA-Z0-9]+/)*[a-zA-Z0-9]+$

我个人认为,第一个应该更快

推荐文章

Sweepy Dodo · JSON lite的格式化

1 年前

Merlin Nestler · 为什么索引中的列顺序在这种情况下会产生如此大的影响?

1 年前

giantjenga · 优化整数向量到二进制向量的转换

1 年前

Adriaantje · Powershell版本的cut-d在处理大文件时速度很慢,我是否错过了快速的方法?

1 年前

Costinean Sebastian · 如何优化使用for循环处理大型数组的MATLAB脚本的执行时间?"

1 年前

Zegarek · Postgresql递归查询未提供预期结果

1 年前

Joe · 为什么这两个查询之间的性能存在如此大的差异?

1 年前

tic-toc-choc · 在`dplyr中高效使用列表进行过滤`

1 年前

Mohan · 是否有一种更快的方法来编写代码,从1:N中提取许多随机样本?

1 年前

user2980746 · 在C#字典中键入xyz对的最有效方法是什么?

1 年前