|
|
1
13
到目前为止,这看起来是一个很好的regex的候选者。如果它变得非常复杂,那么可能需要一个更复杂的标记化方案,但是除非必要,否则您应该避免这条路线,因为这是一个非常多的工作。(另一方面,对于复杂的模式,regex很快就会变成一只狗,同样应该避免)。 此regex应解决您的问题:
以下是它的用法示例:
这种方法的真正好处是可以很容易地扩展到包括您的“-”要求,如:
现在我讨厌读雷杰克斯和下一个家伙一样多,但如果你把它分开,这本书很容易读:
解释
|
|
|
2
1
按字符转到字符串,如下所示:(伪代码排序)
|
|
|
3
1
几天前我只是想知道怎么做。我最终使用了Microsoft.VisualBasic.FileIO.TextFieldParser,它完全满足了我的需要(只需将hasFieldsEnclosedinQuotes设置为true)。当然,在C程序中使用“microsoft.visualBasic”看起来有点奇怪,但它确实有效,据我所知,它是.NET框架的一部分。 为了将字符串放入textfieldParser流中,我使用了“new memoryStream(new asciiEncoding().getBytes(stringVar))”。不确定这是不是最好的方法。 编辑:我不认为这能满足您的“-”要求,所以也许regex解决方案更好 |
|
|
4
0
我正在寻找一个解决这个问题的Java解决方案,并想出了一个使用米迦勒La VoIE的解决方案。我想我会在这里分享它,尽管这个问题被问到C语言中。希望没关系。
|
|
|
John Veridan · 在Python笔记本中仅选择列[无行] 7 年前 |
|
|
seanysull · 修改regex以包含连字符单词 7 年前 |
|
|
Ovaflow · 使用nltk中的标记集计算语音中的不同单词 7 年前 |
|
|
Laurent R · 根据空格和标点符号标记,标点符号保留 7 年前 |
|
|
mrfr · StreamTokenizer在遇到斜杠时停止 7 年前 |
|
|
Rose · Elasticsearch:术语搜索不适用于特殊字符 8 年前 |
|
|
vakarami · 用于提取文件名的模式标记器 8 年前 |
|
|
Konstantin · 用Ruby将单词分解成字母 8 年前 |