代码之家 › 专栏 › 技术社区 › richardtallent

varchar()和nvarchar()之间的奇怪的SQL Server 2005排序规则差异

nvarchar collation unicode tsql sql-server-2005

richardtallent · 技术社区 · 15 年前

有人能解释一下吗:

SELECT 
  CASE WHEN CAST('iX' AS nvarchar(20)) 
      > CAST('-X' AS nvarchar(20)) THEN 1 ELSE 0 END,
  CASE WHEN CAST('iX' AS varchar(20)) 
      > CAST('-X' AS varchar(20)) THEN 1 ELSE 0 END

结果: 0 1

SELECT 
  CASE WHEN CAST('i' AS nvarchar(20)) 
      > CAST('-' AS nvarchar(20)) THEN 1 ELSE 0 END,
  CASE WHEN CAST('i' AS varchar(20)) 
      > CAST('-' AS varchar(20)) THEN 1 ELSE 0 END

结果: 1 1

在第一个查询中, nvarchar() 结果不是我所期望的,但却删除了 X 使 nVARCARCH() 按预期排序。

(我最初的查询使用 '' 和 N'' 要区分的文本语法 varchar() 和 nVARCARCH() 而不是 CAST() 得到了同样的结果。)

数据库的排序规则设置为 SQL_Latin1_General_CP1_CI_AS .

2 回复 | 直到 15 年前

mdma 15 年前

在比较Unicode文本时,对连字符进行特殊处理。Unicode比较使用“字典顺序”,忽略连字符。这不是非Unicode文本比较的情况。

比较 -X 和 iX ,就像比较 X 和 九 如此 -X 左边,更大。当比较“-”和“i”时,就像比较“”和“i”,所以“i”的右边更大。

来自MSDN,

用于排序的SQL排序规则非Unicode数据与不兼容由提供的任何排序例程 Microsoft Windows操作系统系统;但是,分类 Unicode数据与特定版本的Windows 排序规则。因为比较非Unicode和Unicode数据的规则是不同的,当使用SQL时排序规则您可能会看到不同的相同的比较结果字符,取决于基础数据类型。例如,如果您正在使用SQL排序规则 “SQL拉丁1_General_cp1_ci_as”,即非Unicode字符串“a-c”小于字符串“ab”是因为连字符 (“-”)作为单独的在“b”之前的字符。但是,如果您转换这些字符串到unicode,执行相同的操作比较,unicode字符串n'a-c' 被认为大于n'ab' 因为Unicode排序规则使用忽略连字符的“单词排序”。

SELCT body From MSDN_Articles WHERE url IN (“ http://support.microsoft.com/kb/322112 “”

Community Mohan Dere 9 年前

一个好问题!

仔细研究后,我发现这个问题与连字符和撇号有关。您的示例显示了与“'x”和“-x”相同的“奇怪”行为。

我找不到答案,因为答案在这里: SQL Sorting and hyphens

推荐文章

sqlrobert · SQL-如何查找不包含特定字段值的一组记录

2 年前

quango · 如果存在重复项,则从SQL表中删除;如果重复项超过30天,则从中删除

2 年前

Ing. Jose Valera · 使用Mediator的.NET 7中的SqlException问题

2 年前

K.Z · 无法使用ADO获取Insert命令的记录Id。NET 4.0中的NET

3 年前

Nick Fleetwood · 调度语法的LINQ查询

3 年前

Mateen Bagheri · 选择表的计数并选择其自身

3 年前

Zuzi Mufu · SQL Server-正则表达式模式仅匹配字母数字字符

4 年前

oglilprettythug · 在SQL表中插入值时遇到问题,值会被误认为列

4 年前

David Copperfield · 为什么我不能在表中插入值?[重复]

4 年前

Java · 使用交叉应用同时显示两列

4 年前