![]() |
1
58
我觉得这很简单 不 先转换成ASCII码。
|
![]() |
2
18
在python 2.x中,只需在调用upper()之前将字符串转换为unicode。使用您的代码,此网页采用UTF-8格式:
呼唤
在我的例子中,如果您的终端不符合unicode/utf-8标准,您所能期望的最好的方法是使用十六进制字符表示(如mine),或者使用
|
![]() |
3
8
首先,现在我只使用Python3.1;它的主要优点是从Unicode对象中消除了字节字符串的歧义。这使得大多数文本操作比以前更安全。考虑到用户对python 2.x编码问题提出的数万亿个问题,
第二,如果PY3K不是你的口味,那么试着搭配
第一个是,基本上,当使用裸字符串时所做的操作
你可以在什么时候看到
仔细阅读这个列表可以发现很少有拉丁字母、西里尔字母或希腊字母出现;大部分输出是非欧洲字符和标点符号。我唯一能发现python搞错的字符是_¥/¥(\u0524、\u0525,'cyrillic capital small letter pe with downsor'),只要您不在拉丁扩展X块之外(查看这些,它们可能会产生意外),就可以实际使用该方法。当然,我没有检查映射的正确性。
最后,这里是我在PY3K应用程序引导部分中所做的:一种重新定义编码的方法
还有一条建议:当测试时,一定要尝试
最后,引用一句话:“莱夫科维茨在他的文章中说得最好。 Encoding :
更新:刚刚发现python 3在大写时正确地将拉丁文小写字母long s转换为s。整洁! |
![]() |
4
4
我觉得这里缺少一些背景:
只要您使用的是“unicode”字符串而不是“native”字符串,那么upper()之类的运算符就可以使用unicode进行操作。默认情况下,python 3使用unicode,这使得区别在很大程度上不相关。
从中提取字符串
|
![]() |
5
-1
试试看:
|
![]() |
M - · 为什么两个相同的表情符号不相等? 2 年前 |
![]() |
Mohsen · 将字符串从Windows 1256转换为UTF-8 7 年前 |
![]() |
AMINA ARSHAD · 从字符转换为Unicode数字时出错 7 年前 |
![]() |
Taqwa · 在C#[已关闭]中将上标转换为Unicode 7 年前 |