![]() |
1
32
.NET中没有内置的任何东西——但是,这是正则表达式处理实际可能工作良好的情况之一。我将首先将整个字符串转换为小写,然后作为第一个近似值,您可以使用regex查找
下面是一个代码示例:
这可以通过多种不同的方式加以改进,以更好地匹配更广泛的各种句型(不仅仅是以字母+句点结尾的句型)。 |
![]() |
2
7
这对我有用。
|
![]() |
3
3
有一个内置的
来自msdn的示例:
虽然它通常是有用的,但它有一些重要的局限性:
来源: http://msdn.microsoft.com/en-us/library/system.globalization.textinfo.totitlecase.aspx |
![]() |
4
2
我发现了这个 sample on MSDN . |
![]() |
5
2
如果您的输入字符串不是一个句子,而是许多句子,这将成为一个非常困难的问题。 正则表达式将被证明是一个非常宝贵的工具,但是(1)你必须非常了解它们才能有效,(2)它们可能不能完全靠自己来完成这项工作。 考虑这个句子
这个句子不是以字母开头的,它有一个数字、各种标点、一个适当的名字和一个
复杂程度很高,这是一句话。 在使用regex时,最重要的事情之一就是“了解你的数据”。如果你知道你将要处理的句子类型的宽度,你的任务将更易于管理。 在任何情况下,在您对结果满意之前,您都必须玩弄您的实现。我建议用一些示例输入编写一些自动化测试——在您进行实现时,您可以定期运行这些测试,以查看您接近的位置以及您仍然缺少标记的位置。 |
![]() |
6
2
如果您想将包含除句点之外的标点符号的字符串作为大小写的句子:
|
![]() |
7
1
这就是我使用的(vb.net)。它工作在 最 情况,包括:
但是对于专有名词和首字母缩略词…在英语中经常会出现标点符号不那么简单的情况。例如,这个脚本不会检测到省略号(“…”)或缩写(例如:“琼斯先生住在木兰大道上”。在克里斯家附近)。 要完全解决这个问题,您需要为该语言生成一个包含所有可能缩写/标点符号的词典,并使词典保持最新!考虑到这一点后,大多数人会乐于妥协,否则只需使用Microsoft Word。 |
![]() |
8
-1
|
![]() |
Ben · 统计向量中的单词在字符串中出现的频率 3 月前 |
![]() |
bear_525 · 从列中删除中间名和首字母,并保存在单独的列中 5 月前 |
![]() |
asdfadf · 为什么具有相同内存值的字符串和整数打印方式不同? 5 月前 |
![]() |
user764754 · 防止多行原始字符串文字中出现新行字符 5 月前 |
![]() |
Bogaso · 从列表中返回与模式匹配的元素 5 月前 |
![]() |
Jasco · 如何使用VBA提取两个相似字符之间的字符串中的单词? 5 月前 |