|
|
1
7
看起来您的代码是正确的,但是有一些简单的方法可以优化它。例如,您可以为每个单词动态计算p(word | topic),而您可以轻松地预先计算这些值。(我假设你想在这里对多个文档进行分类,如果你只做一个文档,我想这是可以的,因为你不计算文档中没有的单词) 类似地,p(topic)的计算也可以移到循环之外。 最后,不需要对整个数组进行排序就可以找到最大值。 所有的小点!但这就是你的要求:) 我编写了一些未经测试的PHP代码,展示了如何在下面实现这一点:
至于数学。。。 你想最大化p(主题词),所以找到
(即p(topic | words)最高的论点主题)
所以你在找
朴素贝叶斯假设(使其成为朴素贝叶斯分类器)是
在哪里?
以及
|
|
|
John · 分类和回归树-基尼最优分割计算 8 年前 |
|
|
bob · 这个神经网络能进行分离吗? 8 年前 |
|
|
Scott · R中的顺序求值导致错误消息 8 年前 |
|
|
Alex Xu · 如何计算具有相同前缀的ID并将总数存储在另一列中 8 年前 |
|
|
Stanleyrr · 欺诈检测分类ML的经纬度转换 8 年前 |
|
|
Kay · ColumnDataClassifier的最大类数 8 年前 |
|
|
DataMan · 在sklearn RandomForestClassifier中,class\u weight=None是否等同于class\u weight=“balanced\u subsample”? 8 年前 |
|
|
Vidya Marathe · 利用支持向量机预测概率 8 年前 |