牛顿法和梯度下降法的对比和推理

其他 2019-05-12 15:20:56 阅读次数: 0

牛顿法和梯度下降法的学习

牛顿法和梯度下降法的差别

牛顿法：二次逼近
梯度下降法：一阶逼近

牛顿法：对局部凸的函数找到极小值，对局部凹的函数找到极大值，对不凹不凸的函数可能找到鞍点。
梯度下降法：一般不会找到最大值，但同样可能会找到鞍点。

在初始值合理的条件下，
牛顿法的收敛速度＞梯度下降法的收敛速度

牛顿法的计算难度更大（因为需要估计二阶导数）

泰勒展开式：https://baike.baidu.com/item/泰勒公式/7681487?fr=aladdin

即

其中

牛顿法：

对f(x)函数进行二次逼近，即可以开方两次：

我们假设

g（x）是一个关于∆x的一元二次方程，我们知道一元二次方程式的最小值求法：

那么，g(∆x)的极值为：

此时f(x0+∆x)的极值为：

以此类推：

当f是一个多元函数时，牛顿法将会变为：

分子代表梯度（一阶矩阵推广的向量）

，分母代表Hession矩阵：

梯度下降法：

梯度下降法与牛顿法的区别在于梯度下降法是一阶算法。

假设f(x)是个多元函数，x是一个向量，在x0出对f进行线性逼近：

由于一次函数g(x)没有极值，所以梯度下降法只能提供出来下降的方向，而不能提供出需要下降的距离，我们通常只设定一个比较小的距离γ，并使其沿这个方向走下去，并二道梯度下降法的序列：

牛顿法和梯度下降法的本质上都是对目标函数进行局部逼近，所以只能找到局部极值。

猜你喜欢

转载自blog.csdn.net/weixin_38246633/article/details/89379365

牛顿法和梯度下降法的对比和推理

牛顿法和梯度下降法的效率对比

梯度下降法和牛顿法的联系

牛顿法和梯度下降法的区别

梯度下降法和牛顿法的比较

对比牛顿法、梯度下降法的关系

关于梯度下降法和牛顿法的数学推导

机器学习中梯度下降法和牛顿法的比较

梯度下降法和牛顿法的总结与比较

牛顿法和梯度下降法有什么不同？

梯度下降法&牛顿法

梯度类算法原理：最速下降法、牛顿法和拟牛顿法

优化算法之梯度下降法、牛顿法、拟牛顿法和拉格朗日乘数法

最小二乘法(牛顿法和随机梯度下降法)

利用基本梯度下降法和牛顿法对样本进行判别

GBDT与xgb区别，以及梯度下降法和牛顿法的数学推导

最优化算法数学详解之——梯度下降法和牛顿迭代法

梯度下降法、牛顿法及其发展

梯度下降法、随机梯度下降法、批量梯度下降法及牛顿法、拟牛顿法、共轭梯度法

梯度下降和牛顿法的区别

机器学习：梯度下降和牛顿法

梯度下降、牛顿法和拟牛顿法

梯度下降法，牛顿法，拟牛顿法

【math】梯度下降法(梯度下降法，牛顿法，高斯牛顿法，Levenberg-Marquardt算法)

梯度下降法和随机梯度下降法和小批量梯度对比

梯度下降、牛顿法、坐标下降法的优化问题

梯度下降法与牛顿下降法推导

梯度下降法和随机梯度下降

寻优算法——梯度下降法、牛顿法原理认识

牛顿法的收敛速度为何比梯度下降法快？

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)