|
1
46
它确保可以比较Unicode字符串是否相等(即使它们使用不同的Unicode编码)。 来自Unicode标准 Annex #15 :
|
|
|
2
57
形式C和形式D的一个区别是如何表示带重音的字母:形式C使用带重音代码点的单个字母,而形式D将其分为字母和重音。 例如,“_”可以是代码点224(“带抑音符的拉丁文小写字母A”),或代码点97(“拉丁文小写字母A”),后跟代码点786(“组合抑音符”)。 一个副作用是这使得很容易创建一个“删除重音”方法成为可能。
|
|
|
3
6
在Unicode中,(组合)字符可以具有唯一的代码点,也可以具有由基字符及其重音组成的代码点序列。 Wikipedia 以越南语为例列出(u+1ebf)及其分解序列u+0065(e)u+0302(扬抑符重音)u+0301(锐音符)。 string.normalize()在4种正常形式之间转换字符串可以用Unicode编码。 |
|
4
5
|
|
Ben · 统计向量中的单词在字符串中出现的频率 8 月前 |
|
|
bear_525 · 从列中删除中间名和首字母,并保存在单独的列中 9 月前 |
|
|
asdfadf · 为什么具有相同内存值的字符串和整数打印方式不同? 9 月前 |
|
|
user764754 · 防止多行原始字符串文字中出现新行字符 10 月前 |
|
|
Bogaso · 从列表中返回与模式匹配的元素 10 月前 |
|
|
Jasco · 如何使用VBA提取两个相似字符之间的字符串中的单词? 10 月前 |