强化学习/进化算法/贝叶斯优化本质 - 代码天地

强化学习/进化算法/贝叶斯优化本质

其他 2019-06-17 20:24:09 阅读次数: 0

强化学习(RL)：序列决策

本质: 根据实际情况不断改变方法以达到最优解吧

出现原因：

1）增量式的参数更新 (Incremental Parameter Adjustment) ，从输入到输出，有梯度下降完成（增量小，学习过程缓慢（每个增量都需要非常小，才不至于让新学到的信息，把之前学到的经验覆盖了 (这叫做“灾难性干扰”) ））

DRL解决方案：加入RNN时许思想，从过去的事件里学到的信息，都可以立刻派上用场

2）弱归纳偏置 (Weak Inductive Bias) ，任何学习过程，都要面临“偏见-方差权衡”。

给一个定量（偏见），AI快速得到结恶果

DRL解决方案：借鉴过去的经验，给一个狭窄的范围

进化算法：

fitness函数的值，往往就是我们想要的最终结果了，迭代其实只是为了去在函数空间中采点，去搜寻逼近最优的那个值的点

区别：强化学习迭代虽然同样也是为了去在函数空间中采样，但却是为了逼近一个累计的最优值。因此关注时许的累积

贝叶斯优化：

利用先验知识逼近未知目标函数的后验分布，关注各种超参数

猜你喜欢

转载自blog.csdn.net/weixin_38740463/article/details/90699998

强化学习/进化算法/贝叶斯优化本质

游戏优化的本质

人脸识别优化的本质

深度学习的本质探究？？

认清学习的本质

学习的本质是什么？

学习的本质和真谛

Bourne强化学习笔记3：在简单的Bandit问题中抓住强化学习的本质

Floyd算法的动态规划本质

分析 AlphaGo 算法原理的本质

spring学习笔记-spring本质

《学习的本质》读后感

从本质如何理解机器学习

本质：本质

拉普拉斯变化的本质意义

网站优化与SEO的本质区别

人工智能的本质是最优化过程

Batch Normalization本质：平滑优化空间

浅谈ICA算法的概念、本质和流程

数据结构和算法本质的思考

机器学习学习的本质：抽象与模型化

用户运营学习之核心本质详解

学习数据科学的本质--资源路径

Django 2.0 学习(15)：Web框架本质

【C++学习笔记】引用及引用的本质

统计学习理论的本质pdf

学习笔记（一）http通信本质

《统计学习理论的本质》

快速学习-以太坊交易的本质

线性代数的本质学习笔记

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)