![]() |
1
1
这是一个管道,句子拆分器将为标记器提供的标记标识句子边界,但句子拆分器只将相邻的标记分组为句子,而不尝试合并或拆分它们。
正如你所发现的,我认为
您需要:
没有一种标准的英语标记符(通常用于报纸文本)被开发来处理这类文本。 一些相关问题: Does the NLTK sentence tokenizer assume correct punctuation and spacing? How to split text into sentences when there is no space after full stop? |
|
Axel Clerici · 斯坦福NLP:共指消解语料库 7 年前 |
|
meera_meera · 生成任务的BLEU分数 7 年前 |
![]() |
Kay · ColumnDataClassifier的最大类数 7 年前 |
![]() |
nixxo_raa · 如何在Java中提取所有类型的名词? 7 年前 |
![]() |
S.EB · 泰米尔语中有词性标记语和标记语吗? 7 年前 |
![]() |
matt_07734 · 斯坦福大学CoreNLP中的详细情绪分数 7 年前 |