代码之家  ›  专栏  ›  技术社区  ›  Yannis Marossik

如何获得正确的XPath?

  •  2
  • Yannis Marossik  · 技术社区  · 11 年前

    我是XML路径语言的新手。我想要的是使用一个工具来获取XPath,以便在脚本中用于抓取内容。

    例如:

    在…上 http://econpy.pythonanywhere.com/ex/001.html 我想知道所有买家的名字。

    我尝试过Firebug和Chrome DevTools,但它们似乎都产生了一条路径,这不符合我的目的。

    那就是,我明白了 /html/body/div[2]/div 而它应该是 //div[@title="buyer-name"]/text() .

    (我用过 http://docs.python-guide.org/en/latest/scenarios/scrape/ ).

    如有任何建议,我们将不胜感激。

    1 回复  |  直到 11 年前
        1
  •  3
  •   Sebastian Zartner Emmanouil Chountasis    11 年前

    有一个名为Firebug的扩展 FirePath ,增强了Firebug与XPaths相关的功能。最近Firebug中还实现了一个新功能,它允许 copy the minimal XPath .

    不过,它们都基于具有ID的元素创建路径,因此我创建了 enhancement request for Firebug 允许你的要求。我还评论了 feature request for FirePath ,其目标是此。