![]() |
1
3
首先要记住,交叉熵主要用于分类,而MSE用于回归。 在您的例子中,交叉熵测量两个分布之间的差异(真实发生,称为标签-和您的预测) 因此,虽然第一个损失函数作用于softmax层的结果(可以看作是概率分布),但第二个损失函数直接作用于网络的浮点输出(不是概率分布),因此它们不能简单地交换。 |
![]() |
DPM · 将自定义掩码传递给LSTM数据以进行培训和验证 3 年前 |
![]() |
user836026 · 在pytorch中复制权重时语法无效 3 年前 |
![]() |
mad · 如何从一个定制的神经网络模型中获得逻辑和概率 3 年前 |