从Playing Atari with Deep Reinforcement Learning 看神经网络的输入，学习的状态空间 - 代码天地

从Playing Atari with Deep Reinforcement Learning 看神经网络的输入，学习的状态空间

其他 2020-01-12 10:32:11 阅读次数: 0

Introduction：学习直接从高维的感观输入（视觉，语音）去直接控制智能体是强化学习一个长期的挑战。一些成功的RL应用都是依赖于hand-crafted的特征。最近深度学习的进步使提取高水平的特征成为了可能。

参考传送门：https://blog.csdn.net/qq_34718684/article/details/89386302 Playing Atari with Deep Reinforcement Learning

1、预处理：剪裁、灰度化、下采样

Atari 游戏之Breakout，原始图像是：每帧128color的210x160pixel图像，为减小状态空间维数和满足gpu的2d卷积神经网络需要方形输入，对原始图像进行与处理。

预处理前预处理后

注释1：img函数，剪裁31-195像素，游戏相关图像。

注释2：img_temp.mean(axis=2)函数原图像的灰度图

注释3：IM_SIZE 下采样参数，缩放后的图像大小，设置为80

注释3：imresize函数下采样，等比例压缩图片尺寸

参考传送门：http://c.biancheng.net/view/1976.html DQN算法原理及应用（实现Atari游戏）

2、定义输入

输入为84*84*4

为什么输入为4帧？只看上图不能确定板子是向左还是向右，要理解游戏当前的状态，需要考虑动作和观测的序列。因此，考虑四个动作和观测序列的输入来确认情况并训练智能体。

3、定义目标网络 target_network

用DQN的副本建立一个目标网络，并不跟DQN 一起更新，为 DQN 网络生成目标价值函数。每一步中正常更新 DQN，同时在规律性的时间间隔之后更新 target_network。

* 由于所有更新都在 TensorFlow 会话中进行，因此需要使用名称作用域来区分 target_network 和 DQN 网络。

4、导入必要模块，定义训练的超参数、定义DQN类

5、建立会话函数，预测动作函数，执行动作函数，更新策略网络函数。

另：

强化学习资料库：http://www.bubuko.com/infodetail-3171920.html 【干货总结】| Deep Reinforcement Learning 深度强化学习

发布了31 篇原创文章 · 获赞 2 · 访问量 694

私信关注

猜你喜欢

转载自blog.csdn.net/qq446293528/article/details/103701030

从Playing Atari with Deep Reinforcement Learning 看神经网络的输入，学习的状态空间

Playing Atari with Deep Reinforcement Learning论文解读

算法笔记：Playing Atari with Deep Reinforcement Learning

【5分钟 Paper】Playing Atari with Deep Reinforcement Learning

《Playing Atari with Deep Reinforcement Learning 》论文阅读笔记和分析（DQN 2013版）

Playing Atari with Deep Reinforcement Learning:打响DRL的第一枪

DRL在计算机视觉、机器学习等领域的应用 Deep Reinforcement Learning for Atari Games

Playing Go using Deep Reinforcement Learning without Hu

Deep Reinforcement Learning 深度增强学习资源

Relational Deep Reinforcement Learning

022 Deep Reinforcement Learning

Deep Reinforcement Learning is a waste of time

Random Thoughts on Deep Reinforcement Learning

# Asynchronous Methods for Deep Reinforcement Learning

Asynchronous Methods for Deep Reinforcement Learning

强化学习资源——Hands-On Reinforcement Learning、Deep Reinforcement Learning Hands-On等

深度强化学习 Deep Reinforcement Learning 学习整理

深度强化学习：入门(Deep Reinforcement Learning: Scratching the surface)

DRN: A Deep Reinforcement Learning Framework for News Recommendation学习

【资料总结】| Deep Reinforcement Learning 深度强化学习

【干货总结】| Deep Reinforcement Learning 深度强化学习

Asynchronous methods for deep reinforcement learning论文--学习笔记

Deep Reinforcement Learning with Double Q-learning

Deep Reinforcement Learning: Pong from Pixels

Deep Reinforcement Learning 基础知识

Deep Reinforcement Learning （paper reading notes）

解读continuous control with deep reinforcement learning（DDPG）

Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning

Deep Reinforcement Learning with Iterative Shift for Visual Tracking

Dueling Network Architectures for Deep Reinforcement Learning: DuelingDQN

今日推荐

周排行

vue + echart +map中国地图，省市地图，区县地图

spring boot2 (31)-cors跨域请求

『学习资料推荐』299元买的微信营销资料打包

个人学习卷积神经网络的疑惑解答

网络工程师-软考

模拟人生4 春夏秋冬、星梦起飞版更新下载方法以及常见问题

python关于对象的字符串显示str和repr以及

奇怪的session混乱问题

【3】分治法（divide-and-conquer）

Java项目开发成绩管理系统（九）各模块实现信息修改

每日归档

更多

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)