![]() |
1
0
我建议使用马尔可夫链 https://en.wikipedia.org/wiki/Markov_chain 非常小的例子供您参考。 假设你要分析1克。 分析文本:
单位:
每句话以开头。 有两种可能的转变:
这意味着有50%的可能性会以
现在之后
现在之后
因此,通常使用此模型,我们可以生成以下句子:
每一个都有25%要生产
注意,骨头和香蕉总是过渡到
有了数字你就可以把它分成
这只是一个简单的大局,希望能有所帮助 编辑 至于评论中提到的平滑,请使用拉普拉斯。 假设你看到的每个字都比我们看到的多。 例如,现在我们将有:
当然,在这种情况下,我们有非常小的数据集,但对于较大的数据集,您将得到如下信息:
|