代码之家  ›  专栏  ›  技术社区  ›  gsharp

是否有方法在UltraEdit中获取文本文件的编码?

  •  6
  • gsharp  · 技术社区  · 16 年前

    1 回复  |  直到 9 年前
        1
  •  7
  •   Peter Mortensen Pieter Jan Bonestroo    12 年前

    在UltraEdit中,用于显示文件的编码与正在使用的行尾类型(例如“U8-UNIX”)一起显示在右侧的状态栏中。您还可以手动设置文件必须显示的编码。在版本10中,这位于菜单下 -> 。您还可以在菜单下转换文件的实际代码页 文件 -> .

    如果文件没有 BOM header,文件开头的几个字节,表示文件的编码,即文件的实际编码,只能猜测。即使文件有BOM标题,也可能存在编码问题。

    所有的文本编辑器都这样做,有些比其他编辑器更擅长。我还没有做过比较,看看哪个最好。目前(2012年),我知道UltraEdit无法检测到 UTF-8 以及1000行(或更长)文本文件中的其他变体,如果第一个UTF-8字符仅在文档中稍后出现。当您手动设置时,它也无法正确显示编码。

    Notepad++

    Sublime Text 据我所知,它最擅长检测编码,在大文件中也是如此。

    我认为也有一些非常好的命令行工具,从GNU移植到Windows,用于检测编码。我敢打赌,这将是最好的选择。