代码之家  ›  专栏  ›  技术社区  ›  Aravind Yarram

校勘强度与地方语言关系

  •  10
  • Aravind Yarram  · 技术社区  · 14 年前

    我已经从collator的javadoc中阅读了以下内容。

    “语言功能的优势的确切分配取决于语言环境。例如,在捷克语中,“e”和“f”被认为是主要差异,“e”和“e”:是次要差异,“e”和“e”是第三差异,“e”和“e”是相同的。

    这是否意味着我应该根据使用的语言设置强度?如果是这样的话,是否有人会建议本地设置的默认值:us-en、us-es、ca-fr、西班牙\u西班牙语、智利\u西班牙语、葡萄牙语

    1 回复  |  直到 14 年前
        1
  •  11
  •   Johannes Sasongko    14 年前

    真的? 取决于你想做什么。以下对大多数(全部)都是正确的?使用拉丁字母的语言:

    • 初级
      • 不同:A、_、_、B
      • 同:_,_
      • 同样:A,A
    • 次要的
      • 不同:A、_、_、B
      • 不同:_,_
      • 同样:A,A
    • 第三级
      • 不同:A、_、_、B
      • 不同:_,_
      • 不同的:A,A
    • 相同的
      • 还要考虑你看不到的差异,例如 (accented A) (A) + (accent)

    语言之间会有细微的差异,但本质上:

    • 如果需要区分大小写的比较,请使用“三级”。
    • 对于不区分大小写的比较,根据您是否希望_与_分组,使用Primary或Secondary。
    • 有些排序规则很奇怪。a与“即使在初等教育中”也不同,“195”与“195”甚至在初等教育/中等教育中也不同。我不知道为什么,也许是虫子?
    • 谁知道非拉丁语会发生什么。