0
|
Afshin Mehrabani Mohd Jafar · 技术社区 · 7 年前 |
![]() |
1
1
您应该使用这些值本身来计算导数。
计算输出层误差的方程如下(
请注意
本质上,它测量了当输入发生少量变化时,输出变化的速度(以及方向)(可以说,它测量了输出如何依赖于输入)。
我们将误差乘以导数,然后在方向和比例上进行小的更新,以最佳方式优化函数以实现我们的目标。更新应用于权重(激活函数的输入),因此下次激活函数启动时,输出将稍微接近我们的标签。 现在,关于将导数应用于函数的结果或其输入,因为我们希望看到函数的输出根据其输入变化了多少,导数必须取函数的原始输入,以便为我们提供有关它们的信息;这就是为什么导数应用于层的输入(在这种情况下,是最后一层的输出)。
正如你看到的
|
![]() |
Jules · 对神经元子集应用softmax 7 年前 |
![]() |
Viet Phan · Tensorflow:分层Softmax实现 7 年前 |
![]() |
Vato · 使用softmax?选择动作? 8 年前 |
![]() |
Kevin He · MATLAB中是否有GPU实现的多类分类功能? 9 年前 |