版权声明:xbx https://blog.csdn.net/weiweixiao3/article/details/82347414
Solver是什么
Solver的流程:
设计好需要优化的对象,以及用于学习的训练网络和用于评估的测试网络。(通过调用另外一个配置文件prototxt来进行)
通过forward和backward迭代的进行优化来跟新参数。
定期的评价测试网络。 (可设定多少次训练后,进行一次测试)
在优化过程中显示模型和solver的状态
在每一次的迭代过程中,solver做了这几步工作:
1、调用forward算法来计算最终的输出值,以及对应的loss
2、调用backward算法来计算每层的梯度
3、根据选用的slover方法,利用梯度进行参数更新
4、记录并保存每次迭代的学习率、快照,以及对应的状态。
Solver怎么写