1
|
Guillaume Chevalier · 技术社区 · 7 年前 |
![]() |
1
1
困惑 是衡量一个模型对一个样本的预测程度。 根据 Latent Dirichlet Allocation 作者:Blei、Ng和Jordan,
这可以从本文的下图中看出:
在埃森斯,因为 困惑 等于几何平均值的倒数,a 降低 困惑意味着数据是 更多 很可能。因此,随着主题数量的增加 困惑 模型的数量应该减少。 |
![]() |
raksha · 如何查找文档的前n个主题 7 年前 |
![]() |
mel · 如何使用scikit learn获取特定文档的主题概率? 8 年前 |
![]() |
Monica Muller · 将主题模型输出转换为JSON 9 年前 |
![]() |
Ben · LDA:为什么要对新文档进行推理抽样? 9 年前 |
![]() |
myname · Python中使用LDA模型获取样本外文档的主题权重 9 年前 |