代码之家  ›  专栏  ›  技术社区  ›  Dan

在C/Objective-C中提取部分HTML

  •  0
  • Dan  · 技术社区  · 15 年前

    我需要提取一个网站的详细内容,同时保留所有的部门格式。我想摘录的部分是:

    ...
    <div class="detailContent"><p>
    <P dir=ltr><STRONG>Hinweis</strong>: Auf ... </p>
    </div> 
    ...
    

    我目前的解决方案是使用libxml2中的HTMLParser和xpath来查找节点并遍历所有节点来重建这段HTML。这是一个很长很复杂的代码。

    谢谢。

    1 回复  |  直到 15 年前
        1
  •  2
  •   Chuck    15 年前

    简单的Javascript解决方案: document.getElementsByClassName("detailContent")

    结合UIWebView对运行Javascript的支持,您可能会有一个更简洁的解决方案。