正如我们将在5.3节看到的那样,误差函数的梯度可以通过误差反向传播的方法高效地计算出来。这个梯度信息的使用可以大幅度加快找到极小值点的速度。原因如下所述:
在式(5.28)给出的误差函数的二次近似中,误差曲面由$$ b, H
现在,把这种方法与使用梯度信息的算法做比较。由于每个$$ \nabla E
正如我们将在5.3节看到的那样,误差函数的梯度可以通过误差反向传播的方法高效地计算出来。这个梯度信息的使用可以大幅度加快找到极小值点的速度。原因如下所述:
在式(5.28)给出的误差函数的二次近似中,误差曲面由$$ b, H
现在,把这种方法与使用梯度信息的算法做比较。由于每个$$ \nabla E