深度学习（机器学习）优化算法 - 代码天地

深度学习（机器学习）优化算法

编程语言 2020-02-22 13:03:30 阅读次数: 0

一、损失函数：机器学习主要工作是模型评估，而损失函数定义了模型的评估指标!!

常见的损失函数有

mean_squared_error
mean_absolute_error
mean_absolute_percentage_error
mean_squared_logarithmic_error
squared_hinge
hinge
categorical_hinge
logcosh
categorical_crossentropy
sparse_categorical_crossentropy
binary_crossentropy（二元交叉熵）
kullback_leibler_divergence
poisson
cosine_proximity

二、机器学习经典优化算法

（1）直接法：直接给出问题的的最优解

优化问题为凸函数；
有闭解；

（2）间接法：迭代的修正最优解的估计

一阶法：对优化函数进行一阶泰勒展开（梯度下降法）
二阶法：对优化函数进行二阶泰勒展开（牛顿法）

三、梯度检验：计算目标函数的梯度，写出计算梯度的代码后，需要验证自己的代码是否正确!!

四、随机梯度下降算法

（1）综述

经典的梯度下降算法：对参数进行更新时，需要遍历所有的训练数据，计算量大、耗费时间长；
随机梯度下降算法：用单个训练数据就可以对模型参数进行一次更新；

（2）常见的梯度下降算法

批量梯度下降法BGD(Batch Gradient Descent):
针对的是整个数据集，通过对所有的样本的计算来求解梯度的方向。
优点：全局最优解；易于并行实现；
缺点：当样本数据很多时，计算量开销大，计算速度慢
小批量梯度下降法MBGD（mini-batch Gradient Descent）
把数据分为若干个批，按批来更新参数，这样，一个批中的一组数据共同决定了本次梯度的方向，下降起来就不容易跑偏，减少了随机性
优点：减少了计算的开销量，降低了随机性
随机梯度下降法SGD（stochastic gradient descent）
每个数据都计算算一下损失函数，然后求梯度更新参数。
优点：计算速度快
缺点：收敛性能不好

五、随机梯度下降算法的加速

（1）背景有些训练效果差的的原因，并不是模型的问题，而是随机梯度下降算法在优化问题中失效了!!

（2）主要原因

大多数优化问题主要是，陷入局部最优解，而随机梯度下降算法主要问题是山谷和鞍点；
山谷：在山谷中来回反弹震荡，不能按照正确的方向迅速下降，导致收敛不稳定和收敛速度慢；
鞍点：在鞍点处，随机梯度进入一片平坦之地（坡度不明显）导致走错方向，提前停下来；

（3）解决方法

引入动量：惯性保持
AdaGarda：环境感知
Adam：惯性保持+环境感知

六、L1正则化与稀疏性

所谓的稀疏性，就是模型的很多参数为0，相当于对模型进行了一次特征选择，只留下一些比较重要的特征，提高模型的泛化能力、降低过拟合风险！

L1的解空间为多边形，L2的解空间为圆形；
L1对模型参数w引入了拉普拉斯先验，L2正则化引入高斯先验，而拉普拉斯先验使参数为0的可能性更大；

发布了17 篇原创文章 · 获赞 15 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/z15692341130/article/details/104440696

机器学习&深度学习优化算法

深度学习（机器学习）优化算法

机器学习&&深度学习——随机梯度下降算法（及其优化）

深度学习——优化算法

深度学习的优化算法

深度学习优化算法

【深度学习】优化算法

【深度学习】机器学习概述（一）机器学习三要素——模型、学习准则、优化算法

机器学习优化算法

机器学习的优化算法

【深度学习】深度学习优化算法总结

机器学习6 -- 深度学习训练优化

机器学习策略——优化深度学习系统

深度学习—优化算法对比

深度学习优化算法总结

深度学习: 模型优化算法

深度学习中的优化算法

深度学习优化算法集锦

深度学习优化算法比较

深度学习中优化算法

机器学习之路：深度学习 tensorflow 神经网络优化算法学习率的设置

机器学习中优化算法

机器学习中的优化算法

机器学习算法 | 凸优化

机器学习——优化算法（一）

机器学习&深度学习算法及代码实现

深度学习（机器学习）算法面试(二)

深度学习（机器学习）算法面试(一)

机器学习（深度学习）算法的性能度量

深度学习与机器学习算法推导汇总

今日推荐

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

内幕！smardaten无代码平台全方位测评，这些细节你绝对想不到！

idea安装及激活配置流程---2024旗舰版(需激活码)

Elastic 创始人：热爱开源，希望合作 OSI 创建新许可证

工业互联网标识解析体系开放开源下载服务中心发布

IDEA取消自动选择光标所在行

828华为云征文 | 使用Flexus X实例搭建Dubbo-Admin服务

Programmer&AI—AI辅助编程学习指南

【Linux】虚拟机安装 openEuler 24.03 X86_64

o1 发布后 Sam Altman 最新访谈：AI 发展不仅没有放缓，而且我们对未来几年已经胜券在握

AI芯片国产化率100%！运营商最大单集群智算中心投产

周排行

【后端】 Spring Cloud 服务间调用

Git 学习教程

Salesforce集成(三). 获取数据02_获取Object和Field信息

Oracle执行计划的稳定（使用MANUAL类型的SQL PROFILE）

js跨域请求之jsonp原理和运用

ios -解决view遮挡按钮问题

【PAT天梯赛】L2-003 月饼（25 分)（贪心思想）

hive 存储格式的生产应用

【Python实践-6】将不规范的英文名字，变为首字母大写，其他小写的规范名字

容器学习点点滴滴（二）

每日归档

更多

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)

2024-09-24(0)