|
|
1
2
理想情况下,您可以训练模型对输入实例进行分类并生成单个输出。类似于
事实上,你所做的是治疗一个多班级 就像一个回归问题。 这在局部是错误的(除非您正在进行二进制分类,在这种情况下,正输出和负输出都是您需要的)。
这个,每个
|
|
|
2
1
答案在于如何计算最终张量或单个值。在NN中,您的
|
|
3
1
神经网络使用梯度下降来优化损失函数。反过来,这个损失函数需要是可微的。
通常,您描述的输出是通过取这些伪概率的argmax从这个软连续输出中推导出来的。 |