斯坦福机器学习笔记:梯度下降法

关于梯度下降法,很多笔记上都有,本次只记录自己在学习中遇到的问题,及自己的理解。对梯度下降法总体的理解可以参考 线性规划、梯度下降、正规方程组——斯坦福ML公开课笔记1-2

关于样本数与特征数目的关系

学习线性回归的时候,假设遇到如下问题,对房屋的大小和价格需要进行一下线性拟合:
这里写图片描述
这里写图片描述
假设拟合函数为:

hx=θ0+θ1x

这里对应的样本(x,y)可以只取一组,对应的解( θ0θ1 ) 存在多组解。使用梯度下降法可以找到其中的一组解(需要仔细调整步长 α ,否则无法达到收敛值)。
也就是说,在用梯度下降法时,样本数与拟合参数的数目无关。

关于梯度下降法步长与方向

假设cost Function为 J(θ) ,这里只有一个参数 θ 。参数每一步更新值为

θ:=θα(θJ)

其中 (θJ) 只是起到一个正负号的作用,用来判断新的 θ 值的方向

参考

深入梯度下降(Gradient Descent)算法

猜你喜欢

转载自blog.csdn.net/jayandchuxu/article/details/75137516