![]() |
1
3
不,没有这样的正则表达式。注意,使用regex可以“描述”一段特定的文本。
某些regex实现可能提供使用regex进行替换的可能性,但这些替换通常只由单个替换执行:而不是替换
也许您使用的语言在其API中有一个方法来执行这种替换,但它不会使用regex。 |
![]() |
2
11
乌普一这是做不到的,你不应该想做!这是对全世界的冒犯,而且相信faÃade与arcade押韵,或者认为CaÃon City,Colorado属于教规,这是一种无知。 您可以通过Unicode规范化表单D运行字符串并丢弃标记字符,但我肯定不会告诉您如何操作,因为它是 邪恶与错误 . 它是邪恶的,原因已经概述过了,它是错误的,因为它根本没有解决无数的案例。 学习材料以下是您需要阅读的内容:
你 必须 学习如何用一种有意义的方式来比较字符串,而对它们进行肢解根本没有任何意义 [pÊlp] 永远。 决不能只是逐代码点比较未格式化的字符串,如果可能,还需要考虑语言,因为它们之间的规则不同。 实例无论您使用的编程语言是什么,它都可以帮助您阅读Perls的文档 Unicode::Normalize , Unicode::Collate ,和 Unicode::Collate::Locale 模块。
例如,要搜索
那将
这个
你有一个选择:你可以做正确的,或者你根本做不到。 如果你做错了,没人会感谢你的。 做得好就意味着要考虑UAX#15和UTS#10。 在这个时代,没有比这更糟的事了。你知道,现在已经不是60年代了! |
![]() |
M - · 为什么两个相同的表情符号不相等? 3 年前 |
![]() |
Mohsen · 将字符串从Windows 1256转换为UTF-8 7 年前 |
![]() |
AMINA ARSHAD · 从字符转换为Unicode数字时出错 7 年前 |
![]() |
Taqwa · 在C#[已关闭]中将上标转换为Unicode 7 年前 |