![]() |
1
2
结果又是形状的问题。使用matmul,就像我在那里做的那样,生成形状(n,1)的输出。在预期形状(n,)的上下文中使用它,会无声地生成二次放大。
解决方案是挤压。明确地
|
![]() |
2
1
内存消耗像这样激增是有道理的,因为backprop需要额外的内存来跟踪每个操作的梯度(尽管我不知道它是如何以二次方式结束的)。 解决方案:小批量
在训练模型时,这通常是goto方法。将您的培训数据拆分为几个小批量,每个小批量包含固定数量的样本(很少超过200个样本),然后将其一次一个小批量地提供给优化器。所以如果你的
我想试试这样的
|
![]() |
Chris · 如何捕获导入脚本功能的打印 3 年前 |
![]() |
Danijel · C中TensorFlow模型文件的路径? 3 年前 |
![]() |
Arya Anish · tensorflow安装中面临的问题 3 年前 |