![]() |
1
2
您使用相当复杂的代码进行培训/推理。但是如果你稍微挖掘一下,你会发现损失函数已经实现了。
here
你的模型实际上是用
对于数值稳定性而言,最好是将SoftMax“吸收”到损失函数中,而不是通过模型进行明确计算。
|