代码之家  ›  专栏  ›  技术社区  ›  jvhashe

如何解析无效(格式错误/不正确)的XML?

  •  27
  • jvhashe  · 技术社区  · 7 年前

    目前,我正在开发一个功能,该功能涉及解析我们从另一个产品收到的XML。我决定对一些实际的客户数据进行一些测试,而另一个产品似乎允许用户输入本应被视为无效的内容。无论如何,我仍然需要设法找到解析它的方法。我们正在使用 javax.xml.parsers.DocumentBuilder 我得到一个输入错误,如下所示。

    <xml>
      ...
      <description>Example:Description:<THIS-IS-PART-OF-DESCRIPTION></description>
      ...
    </xml>
    

    可以看出,描述中似乎有一个无效的标记( <THIS-IS-PART-OF-DESCRIPTION> DocumentBuilder.parse(...)

    我知道这是无效的XML,但可以预见它是无效的。有没有办法解析这些输入?

    4 回复  |  直到 7 年前