下载了几份代码,就两份没有报错通过了
DQN玩FlappyBird
https://github.com/yenchenlin/DeepLearningFlappyBird
DQN玩Cartpole
https://www.cnblogs.com/caorui/p/6431156.html
思路主要是这样的,像玩小鸟的就是通过障碍物能继续走,reward 1和-100, action也是1和0,玩平衡车是能立住就reward是1,立的时间长评分高,并不是reward
平衡车位置:D:\virtualenv\venv\env37\gym\envs\classic_control\cartpole.py