|
1
1
这取决于你要找回什么。我自己也不是PHP专业人士,但我会这样做:
如果您不介意将其余的原始HTML放在那里,那么应该使用这个方法。否则,其他人可能会有更好的解决方案。 |
|
|
2
2
XPath 而不是正则表达式。 |
|
|
3
1
虽然正则表达式可以很好地处理各种各样的任务,但我发现它在解析htmldom时通常是不够的。HTML的问题是,文档的结构非常多变,很难准确地(准确地说,我的意思是100%的成功率没有假阳性)提取标记。
我建议您使用DOM解析器,例如
有些人可能认为这是一种过分的做法,但最终,它将更易于维护,并允许更多的可扩展性。例如,使用DOM解析器,我还可以获得alt属性。
可以设计一个正则表达式来实现相同的目标,但是它的限制方式会使
另外,请考虑以下几点。正确匹配
同样,如果出现以下情况,上述操作可能会失败:
同样,不要使用正则表达式来解析dom文档。 |