|
1
|
| Maksim Khaitovich · 技术社区 · 8 年前 |
|
1
2
我认为您需要的是词干处理,即删除具有公共根的单词的结尾,这是预处理文本数据的基本操作之一。 https://nlp.stanford.edu/IR-book/html/htmledition/stemming-and-lemmatization-1.html |
|
|
Hackerds · 在正则表达式中捕获多个组不会返回任何结果 7 年前 |
|
|
BARIK FATI · 如何构建hashtags语料库(文本挖掘) 7 年前 |
|
|
Max TC · 在R中匹配并替换字符串中拼写错误的单词 7 年前 |
|
|
Bhavya · 从R中的dtm中按每个文档的频率提取顶部特征 8 年前 |
|
|
FF0605 · 如何在python中将多个句子转换为二元图 8 年前 |
|
|
Ravindra Nadh · twitter用户名的R正则表达式 8 年前 |