代码之家  ›  专栏  ›  技术社区  ›  user2427

java/groovy中如何实现网页从ISO-8859-1到UTF-8的转换

  •  2
  • user2427  · 技术社区  · 15 年前

    我想根据浏览器读取ISO-8859-1字符集中的网页a,并将UTF-8中的内容作为网页B的内容返回。

    这是:我想用我用来显示页面B其余部分的相同字符集来显示页面A的内容,即UTF-8。

    如何在java/groovy中做到这一点?

    提前谢谢

    2 回复  |  直到 15 年前
        1
  •  3
  •   Christoph Metzendorf    15 年前

    在Groovy中,您可以编写如下内容:

    def source = new URL("http://www.google.com").getText("ISO-8859-1")
    def target = new String(source.getBytes("UTF-8"), "UTF-8")
    
        2
  •  1
  •   McDowell rahul gupta    15 年前

    你不会说你在构建什么堆栈或者你是如何访问内容的,但是这种代码转换操作的一般机制是使用UTF-16作为中介;也就是说,将ISO-8859-1字节转换为UTF-16字符再转换为UTF-8字节。

    你可以用 InputStreamReader Charset ),然后通过 OutputStreamWriter (带UTF-8 ).

    一些API提供编码操作作为其I/O类的一部分(例如。 ServletResponse.getWriter() ).

    我忽略了解析和转换数据的任何需要,这是另一种蠕虫。