|
|
1
5
使用 设置 对于停止语:
和输入txt_file的ArrayList
|
|
|
2
1
您想从文件中删除重复的单词,下面是相同的高级逻辑。
现在您已经设置了包含文件中所有唯一单词的集合。 |
|
|
3
1
使用
希望这能有所帮助。 |
|
|
4
0
如果你只是想从文件中的单词中删除一组特定的单词,你可以随心所欲。但是,如果你正在处理一个涉及自然语言处理的问题,你应该使用一个库。 例如,使用 Lucene 因为标记化一开始看起来会更复杂,但它会处理你会忽略的无数复杂问题,如果你改变主意,改变特定的权宜之计,改变你如何标记化,是否关心案件等,它会有很大的灵活性。 |
|
|
5
0
你应该尝试使用
|
|
|
user3778289 · 如何在Python中逐个读取文件中的令牌? 8 年前 |
|
|
Darzen · 无法使用nltk从单词序列中删除停止单词 12 年前 |
|
|
pamiers · 如何删除java中的停止字? 13 年前 |