|
|
1
1
您的损失函数在程序上是正确的,以下除外:
当你这样做的时候
现在,您是否尝试使用自定义丢失来模拟CE丢失?如果是的话,那么你就错过了
修复添加
另外,我注意到学习速度很慢,即使有CE丢失,结果也不一致。将学习率提高到1e-3对我来说在海关和CE损失的情况下很有效。 |