![]() |
1
0
我想知道您是否可以重写xpath表达式以更快地运行?可能有效的一件事是避免构建名称列表节点集(如果以后不需要它的话),并将节点计数在lxml中。像这样:
否则,您可能会发现 expat parser 提取文本的速度更快,但它没有进行验证,而且使用起来更复杂(您需要编写一个状态机和几个回调)。如果只需要文本,使用 C implementation of the element tree API . 这个 lxml benchmarks 做有趣的阅读,并且确实似乎暗示你可以用它更快地提取文本。 一个常见的XPath性能问题是表达式开头不需要使用“//”。在这种情况下,使表达式绝对化,例如:
如果文档的结构允许这样做,则速度会更快。不过,这不应该成为一个问题。 |
![]() |
2
0
这个 lxml benchmarks 非常有用。在我看来,使用xpath提取元素节点很快,但提取文本可能很慢。下面,我有三个非常快的解决方案。
|
![]() |
July · 如何定义数字间隔,然后四舍五入 1 年前 |
![]() |
user026 · 如何根据特定窗口的平均值(行数)创建新列? 1 年前 |
|
Ashok Shrestha · 需要追踪特定的颜色线并获取坐标 1 年前 |
![]() |
Nicote Ool · 在FastApi和Vue3中获得422 1 年前 |
|
Abdulaziz · 如何对集合内的列表进行排序[重复] 1 年前 |
![]() |
asmgx · 为什么合并数据帧不能按照python中的预期方式工作 1 年前 |