|
|
1
87
Unidecode 看起来是一个完整的解决方案。它将花哨的引号转换为ASCII引号,将重音的拉丁字符转换为非重音,甚至尝试音译处理没有ASCII等价物的字符。这样你的用户就不必看到一堆?当你必须通过传统的7位ASCII系统传递他们的文本时。
http://www.tablix.org/~avian/blog/archives/2009/01/unicode_transliteration_in_python/ |
|
|
2
24
在我最初的回答中,我也建议
在任何情况下,您都可以使用
如果需要,您可以添加更多的标点符号映射,但我认为您不必担心处理每个Unicode标点符号字符。如果你
做
需要处理重音符号和其他音调符号,您仍然可以使用
|
|
|
3
19
有趣的问题。 谷歌帮我找到 this page 说明使用 unicodedata module 如下所示:
|
|
|
4
3
有关此问题的其他讨论,请访问 http://code.activestate.com/recipes/251871/ 它有nfkd解决方案和一些转换表的方法,例如_±=>+/-和其他非字母字符。 |
|
oymonk · 如何使Excel识别Unicode CSV上的数据列? 11 月前 |
|
|
Boltu · pandas从url返回的值是什么? 1 年前 |
|
|
trystine · 试图运行CausalNex错误UnicodeEncodeError:“charmap”编解码器无法对位置263607-263621中的字符进行编码:字符映射到<undefined> 1 年前 |
|
|
Danny Coleiro · 向文本字符串添加不可见字符 1 年前 |