代码之家  ›  专栏  ›  技术社区  ›  Faizan S.

Java SAX解析器中的UMLUT

  •  0
  • Faizan S.  · 技术社区  · 15 年前

    我目前在收到的XML文档中遇到德国umlaut值问题。

    它将值显示/保存为 阿尔法 “而不是” γ “。

    XML编码设置为 UTF-8 它应该能够显示umlauts。

    另外,我也找不到任何选项来设置SAX解析器上的区域设置。

    是否有其他方法可以使值正确保存?

    顺便说一句:我使用Eclipse作为IDE。

    非常感谢您的帮助!

    事先谢谢!

    2 回复  |  直到 12 年前
        1
  •  2
  •   erickson    15 年前

    XML是以UTF-8编码的,但您正在使用ISO-8859-1对其进行解码。

    尝试使用 InputStream 以及其他面向二进制的XML API。避免使用 Reader 或试图从 byte[] 到A String 在分析XML之前。与解析器相比,您更可能搞乱字符编码。

        2
  •  0
  •   The Chairman    15 年前

    在XML声明中将XML编码设置为UTF-8是一回事,但另一件事是XML文档的物理编码,也就是说,您可以有一个XML文件 <?xml version="1.0" encoding="utf-8"?> 但文件本身可能仍然是ANSI编码的(或其他)。