代码之家  ›  专栏  ›  技术社区  ›  landyman

测试字符串中的日语/中文字符

  •  6
  • landyman  · 技术社区  · 16 年前

    我有一个程序,它读取一堆文本并对其进行分析。文本可以是任何语言,但我需要专门测试日语和汉语,以便以不同的方式分析它们。

    我读过,我可以测试每个字符的Unicode编号,以确定它是否在CJK字符范围内。这很有用,但是如果可能的话,我想将它们分开,以便根据不同的词典处理文本。有没有办法测试一个字符是日语还是汉语?

    6 回复  |  直到 8 年前
        1
  •  6
  •   Elijah    16 年前
        3
  •  1
  •   Don Kirkby    16 年前

        4
  •  0
  •   si28719e    16 年前

        5
  •  0
  •   soycamo    15 年前

        6
  •  0
  •   hippietrail    14 年前