基于事后筛选经验回放的机器人深度强化学习跟踪控制
针对机械臂轨迹跟踪问题,提出了一种结合事后筛选经验回放(selective hindsight experience replay, SHER)的深度强化学习(deep reinforcement learning, DRL)控制方法。此算法将SHER与深度确定性策略(deep deterministic policy gradient, DDPG)结合进行机械臂的轨迹跟踪控制。SHER算法将智能体探索的经验进行随机抽取,然后筛选有用经验修改奖励函数,通过提高对正确动作的奖励评分加强对智能体正确动作的正反馈强度从而提高智能体探索效率。为了验证方法的有效性,通过欧拉-拉格朗日建模二自由度机械臂并在具有干扰的复杂环境下进行仿真实验对比。实验结果表明,所提算法在机械臂轨迹跟踪任务中收敛速度以及收敛稳定性与对比算法相比最优,并且训练出来的模型与对比算法相比在轨迹跟踪任务中表现最好,验证了算法的有效性。
计算机应用研究
2025年03期
立即查看 >
图书推荐
相关工具书