强化学习（4）----简介

其他 2020-07-23 17:15:08 阅读次数: 0

视频：David Silver深度强化算法学习 +项目讲解

书籍：reinforcement learning

博客：https://blog.csdn.net/lagrangesk/article/details/80943045

一、强化学习

人类通常从与外界环境的交互中学习。

当我们在开车或者聊天时，我们会意识到自身行为会收到环境的反馈，然后根据行为去得到想要的结果。

强化学习是指从环境状态到行为映射的学习以使系统行为从环境中获得的累积奖励值最大。强化学习描述的是一个与环境交互的学习过程。

以人开车为例，将人和车作为一个整体（agent)，外界红绿灯、车道线等信息构成了环境（environment)，然后人通过控制车辆向左、向右转弯或者直行的动作（action)，影响了这个环境的状态（state)，比如说前方有车，向右转弯后车道前没有车辆，这就说明车辆的动作影响了环境的状态。

但是，仅仅有了agent、environment、state和action还不够，需要有一个奖惩来指导agent的行动，这就是reward，比如车辆闯红灯会收到罚单。那么说到这里，大家一定很好奇：reward是如何指导强化学习的呢？首先我们要从强化学习的特性说起。

强化学习的两个重要特性：

试措搜索（trial -and-error search)
延期强化（deplayed reinforcement）

强化学习模型：

猜你喜欢

转载自www.cnblogs.com/Lee-yl/p/13367291.html

强化学习（4）----简介

强化学习简介

UCBerkeley 深度强化学习-强化学习简介Lec4

强化学习（1）----简介

强化学习(一)：简介

强化学习入门简介

强化学习（一）——简介

强化学习系列（一）：强化学习简介

重温强化学习之强化学习简介

强化学习系列1：强化学习简介

强化学习(一)：简介——什么是强化学习？

【强化学习知识】强化学习简介

【强化学习】01—— 强化学习简介

深度强化学习之简介

RL— 深度强化学习简介

强化学习 4. 动态规划

4、强化学习--model free 控制

2019年伯克利大学 CS294-112《深度强化学习》第4讲：强化学习简介（笔记)

强化学习学习笔记（一）：入门简介

【强化学习】强化学习介绍

【强化学习】强化学习分类

[强化学习]强化学习基础

强化学习之Q-learning简介

《强化学习》第一讲：简介

David Silver强化学习公开课（一）：简介

强化学习简介及马尔科夫决策过程

强化学习的学习～

强化学习学习

强化学习步骤

WAF 强化学习

今日推荐

AI小程序有哪些？AI小程序哪个好用？微信小程序AI写作叫什么？免费的ai小程序推荐 ai写作小程序推荐

灵办AI工具(科研学术,代码编程,学习辅导,图书报告)功能介绍

Linux内核源码分析（非常详细）零基础入门到精通，收藏这一篇就够了

【C++篇】启航——初识C++（上篇）

数据飞轮崛起：数据中台真的过时了吗？

828华为云征文——使用Flexus云服务器X实例CentOS镜像下创建MySQL服务器教程

阿里巴巴出品的6款AI神器，你用过几个？

【机器学习】多模态AI——融合多种数据源的智能系统

HashiCorp 创始人向 Zig 软件基金会捐赠 30 万美元

1-8 月我国软件业务收入 85492 亿元，同比增长 11.2%

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

周排行

Ubuntu+apache2+php5+mysql+phpmyadmin的php环境搭建

基于YOLOv3+Kalman-Filter实现Multi-target tracking

解释C++实例化类的指针类型中的new

苹果手机页面不兼容问题——mui

Python基础语法

javascript学习笔记一【预解释】

python内置函数 map

【Git】使用webstorm操作git

this与super关键字（一）

python list 使用技巧

每日归档

更多

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)