|
|
1
5
这种处理可能非常棘手。这个简单的代码几乎可以做正确的事情:
生产:
要包括“约瑟夫·贝尔博士”,你需要确定字符串中的句号,它允许在“爱丁堡皇家医务室”。像福尔摩斯一样。 我也有类似的问题: Separating Sentences . |
|
|
2
2
“重新”的方法很快就失去了动力。命名实体识别是一个非常复杂的主题,远远超出了SO答案的范围。如果你认为你对这个问题有一个很好的解决方法,请把它指向弗兰·奥布赖恩·A.K.A.迈尔斯·纳科帕莱恩、苏加诺、哈里·S.杜鲁门、J.埃德加·胡佛、J.K.罗琳、数学家L'Hopital、乔·迪·马吉奥、阿尔杰农·道格拉斯·蒙塔古·斯科特和雨果·马克斯·格拉夫·冯·恩德·祖勒钦费尔德·奥夫·肯弗林和施伯格。 更新 下面是一个“重新”的方法,它可以找到更多有效的案例。不过,我仍然认为这不是一个好方法。注意,我已经在我的文本样本中说明了巴伐利亚计数的名称。如果有人真的想使用类似的东西,他们应该使用Unicode,并在某个阶段(输入或输出)将空白标准化。
输出:
|
|
|
David542 · 任何语言都允许函数名中有空格吗? 1 年前 |
|
Andy · 将LENGTH OF移动到COMP字段解析失败 1 年前 |
|
|
Chris Geo · 如何找到LR0项目的FOLLOW集合? 1 年前 |
|
|
Yash Singhal · 在reactjs中解析Pdf中的文本 1 年前 |
|
|
i33SoDA · 如何将逗号分隔的数字字符串解析为int数组? 1 年前 |