|
7
|
| Patrick Desjardins · 技术社区 · 17 年前 |
|
|
1
13
您还需要在DIV标记中的类之前考虑其他内容。
另外,不区分大小写。您可能需要转义引号或结束标记中的斜线。你在做这个的背景是什么? 还要注意,根据输入的不同,使用正则表达式进行HTML解析可能非常麻烦。下面的答案提出了一个很好的观点——假设您的结构如下:
尝试为它构建一个regex会带来灾难。您最好的选择是将文档加载到一个DOM中,并对此执行操作。 应紧密映射到xml::dom的伪代码:
这是一个Perl库, HTML::DOM 和另一个, XML::DOM .NET具有用于处理DOM分析的内置库。 |
|
|
2
17
正如其他人所说,HTML是众所周知的难以处理使用regex的问题,而DOM方法可能更好。例如。:
|
|
|
3
1
在Perl中,您需要
也就是说,使用适当的HTML或XML解析器删除HTML文件中不需要的部分更为合适。 |
|
|
4
0
部分取决于您使用的确切regex引擎-哪种语言等,但有一种可能是您需要转义引号和/或正斜杠。你可能还想让它不区分大小写。
否则,请说出你使用的语言/平台——.NET、Java、Perl… |
|
|
5
0
试试这个:
最大的问题是嵌套标签。例如:
给定的regexp将通过
|
|
|
6
0
由于正则表达式的贪婪性,这将是很棘手的,(请注意,我的示例
可以
针对Perl,但我知道贪婪是Res.)的一个普遍问题。
表达式将匹配:
这不太可能是你想要的。 |
|
|
7
0
为我工作,但需要在特殊字符之前使用反斜杠
|
|
|
8
-3
为什么不
|
|
|
Carsten · 使用最近的搜索模式更改文本块 1 年前 |
|
|
A.Ellett · 测试-t STDIN与-t<STDIN> 1 年前 |
|
|
con · 如何跳转到foreach迭代的特定点? 1 年前 |