基于强化学习的空间机械臂控制方法

发布时间：2023-04-22 11:33

　　针对现有空间机械臂控制方法在实际应用中调试时间长、稳定性差的问题,提出一种基于深度强化学习的控制算法。构建仿真环境用于产生数据,通过状态变量实现仿真环境与深度强化学习算法的交互,通过奖励函数实现对神经网络参数的训练,最终实现使用近端策略优化算法(Proximal Policy Optimization,PPO)控制空间机械臂将抓手移动至物体下方特定位置的目的。实验结果表明,本文提出的控制算法能够快速收敛,实现控制空间机械臂完成特定目标,并且有效降低抖动现象,提升控制的稳定性。

【文章页数】：6 页

【文章目录】：
0 引言
1 PPO算法
2 基于PPO的控制算法
    2.1 系统组成
    2.2 训练环境
    2.3 基于PPO的控制决策算法
3 仿真校验
4 结论

本文编号：3797559