强化学习DQN episode是什么

Agent将会从一个状态到另一个状态这样去探索,直到它到达目标状态。我们称每一次这样的探索为一个场景(episode)。


每个场景就是 Agent 从起始状态到达目标状态的过程。

每次Agent 到达了目标状态,程序就会进入到下一个场景中。

 基于深度强化学习的智能体系结构参数调优 - 知乎CAPES(Computer Automated Performance Enhancement System) 1 摘要存储系统的参数调整是存储系统优化的一个重要方法,当前的参数调整实践通常涉及大量的基准调整周期,耗时耗力,所以需要一个无监督模型来进行参…https://zhuanlan.zhihu.com/p/339964218

猜你喜欢

转载自blog.csdn.net/u013288190/article/details/126853227