1、Reinforcement learning neural network (RLNN) based adaptive control of fine hand motion rehabilitation robot
自适应控制康复机器人期望轨迹力辅助
算法:actor-critic based RLNN
详见:【强化学习】Actor-Critic算法详解
2、强化学习
监督学习解决智能感知。输入大量差异化带标签数据,学习特征和特征对应的标签。
强化学习解决序贯决策。当前采用什么动作,可以使整个任务序列最优。与环境交互,获得奖励。
92年策略梯度估计,13年DQN,深度强化学习。