代码之家 › 专栏 › 技术社区 › StatsNoob

带tf的张量流梯度。NaN本不应该返回的地方

gradient tensorflow python

StatsNoob · 技术社区 · 7 年前

以下是可复制代码。如果您运行它,您将看到在第一次sess运行中,结果是nan,而第二种情况给出了正确的渐变值0.5。但根据tf。如果指定了和条件,则它们应返回相同的值。我也不明白为什么tf。其中,函数梯度为nan,为1或-1,这对我来说似乎是非常好的输入值。

tf.reset_default_graph()
x = tf.get_variable('x', shape=[1])
condition = tf.less(x, 0.0)
output = tf.where(condition, -tf.log(-x + 1), tf.log(x + 1))
deriv = tf.gradients(output, x)
with tf.Session() as sess:
    print(sess.run(deriv, {x:np.array([-1])}))

logg = -tf.log(-x+1)
derivv = tf.gradients(logg, x)
with tf.Session() as sess:
    print(sess.run(derivv, {x:np.array([-1])}))

感谢您的评论!

1 回复 | 直到 7 年前

P-Gn 7 年前

如中所述 github issue 由@mikkola提供,问题源于 tf.where .基本上,两个备选方案(及其梯度)都是计算出来的,只有正确的部分是通过条件乘法选择的。唉,如果梯度是 inf 或 nan 对于以下部分不选中,即使乘以0,也会得到 南安 最终传播到结果。

自2016年5月发布以来(即tensorflow v0.7!)由于没有修补,人们可以放心地认为这不会很快出现,并开始寻找解决方法。

最简单的修复方法是修改语句,使它们始终有效且可微,即使对于不打算选择的值也是如此。

一般的技术是将输入值裁剪到其有效域内。因此,以您的情况为例,您可以使用

cond = tf.less(x, 0.0)
output = tf.where(cond,
  -tf.log(-tf.where(cond, x, 0) + 1),
  tf.log(tf.where(cond, 0, x) + 1))

但是,在您的特定情况下,仅使用

output = tf.sign(x) * tf.log(tf.abs(x) + 1)

推荐文章

albert · AttributeError:“str”对象没有属性“str”如何解决此问题

2 年前

Anshuman Sinha · 将tensforflow中的所有nan值转换为零

2 年前

CoccoSyn · Keras TypeError:其中一个输入没有可接受的类型。具有参差不齐张量的LSTM

3 年前

rob me of my freedom · 在不使用Y_pred和Y_actual的tensorflow中编写自定义损失

3 年前

Chris · 如何捕获导入脚本功能的打印

3 年前

Jay Bhie Santos · 剩余GRU:ValueError:输入具有不兼容的形状。收到的形状(5)和(24)

3 年前

Danijel · C中TensorFlow模型文件的路径?

3 年前

Joseph · 重塑BatchDataset训练模型的输入-Tensorflow

3 年前

Arya Anish · tensorflow安装中面临的问题

3 年前

so beautiful memory · 如何将我在本地训练的tensorflow模型正确部署到谷歌云人工智能平台?我部署了它,但没有图像返回

3 年前