RL(Reinforcement Learning)中经常使用算法分类

RL算法分类

主要根据value-based和policy-based以及结合了基于值和基于概率的常见强化学习算法进行了分类。

RL中常见算法分类以及区别
欢迎进行补充和讨论以及指正。

猜你喜欢

转载自blog.csdn.net/weixin_45187794/article/details/108542519
今日推荐