Andrew Ng-ML-第十八章-大规模机器学习

1.学习大数据集

图1.学习大数据集

 当数据集量为m=1亿时,进行梯度下降将会花费较大时间。

可以使用小量数据集进行训练,然后得出学习曲线。

左图是高方差,右图是高偏差。

总之是要通过高效的学习算法来进行大数据学习。

2.随机梯度下降

图2.批梯度下降

 假设是美国人口普查的数据,m=3亿,如果需要每次读入,并且计算(for every j=0,....n),对每一个参数θ都有这么一个计算,就非常复杂了。

猜你喜欢

转载自www.cnblogs.com/BlueBlueSea/p/9504871.html