3
|
Suhail Gupta · 技术社区 · 7 年前 |
![]() |
1
5
您不必手动运行迭代,而且
不应该
呼叫
呼叫
另外,不要用开始
另外,4000个训练阶段的规模也大得离谱。当处理数万到数百万的文档时,10-20的值在已发表的作品中很常见。如果数据集较小,则可能无法很好地处理
一个好的介绍(尽管有一个很小的数据集
https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/doc2vec-lee.ipynb 祝你好运! |