![]() |
1
31
我不知道这些语言中的特殊字符是如何分类的,但您可以检查
这个
|
![]() |
2
6
调查
例如:
|
![]() |
3
4
字符黑名单可能非常大:-) 可以使用正则表达式
以匹配十进制数字和字母,不管脚本如何。
这个正则表达式由一个字符类组成,该类包含
对于某些regex引擎,由于您只对拉丁字母感兴趣,显然,您也可以使用
但是,.NET不支持此功能。上面提到的第一个regex实际上捕获了 任何 脚本。因此,它将尽职匹配印度或阿拉伯数字和希伯来语,西里尔文和其他非拉丁语脚本。取决于你想要什么,这可能不合适。
如果这造成了一个问题,那么我认为没有比显式列出您要允许的字符更好的选择。然而,我认为假设某种语言的文本总是局限于该语言的脚本是危险的。如果我用德语写一个捷克语或波兰语的名字,那么我可能需要的不仅仅是
|
![]() |
4
-1
匹配允许的字符捕获一个错误的返回会更简单。 |
![]() |
Ben · 统计向量中的单词在字符串中出现的频率 5 月前 |
![]() |
bear_525 · 从列中删除中间名和首字母,并保存在单独的列中 6 月前 |
![]() |
asdfadf · 为什么具有相同内存值的字符串和整数打印方式不同? 6 月前 |
![]() |
user764754 · 防止多行原始字符串文字中出现新行字符 7 月前 |
![]() |
Bogaso · 从列表中返回与模式匹配的元素 7 月前 |
![]() |
Jasco · 如何使用VBA提取两个相似字符之间的字符串中的单词? 7 月前 |