![]() |
1
14
读取文件时,所读取的字符串是一个字节字符串。for循环一次迭代一个字节。这会导致UTF-8编码字符串出现问题,其中非ASCII字符由多个字节表示。如果要使用Unicode对象,其中字符是基本部分,则应使用
如果
|
![]() |
2
2
使用codecs.open,它对我有效。
|
![]() |
3
1
看看这个:
它返回这个:
圣克鲁克
问题是文件只是作为一个字节串被读取。通过迭代,可以将多字节字符拆分为无意义的字节值。 |
![]() |
4
1
添加一个“空白字符转换器”,并将正确的UTF-8序列拆分为不正确的序列。因此,除非您将一个signle字节写入输出,否则这将不起作用。
|
![]() |
5
0
一个人可能只想用
|