|
|
1
0
似乎tf.norm受到了数字不稳定性的影响 here 他们还建议使用更稳定的数值的l2范数,所以我尝试了这个方法,也得到了NaN值,这要归功于0梯度。所以我把它们和梯度削波结合起来,到目前为止效果很好,损失函数起作用,并设法收敛。 定义最后一次尝试(是,是pred): 将TensorFlow导入为tf 将numpy导入为np
有很大的空间优化这个函数,这里有一个参考我的另一个 SO question -正在努力。 谢谢大家 |