基于强化学习的空间机械臂控制方法
发布时间:2023-04-22 11:33
针对现有空间机械臂控制方法在实际应用中调试时间长、稳定性差的问题,提出一种基于深度强化学习的控制算法。构建仿真环境用于产生数据,通过状态变量实现仿真环境与深度强化学习算法的交互,通过奖励函数实现对神经网络参数的训练,最终实现使用近端策略优化算法(Proximal Policy Optimization,PPO)控制空间机械臂将抓手移动至物体下方特定位置的目的。实验结果表明,本文提出的控制算法能够快速收敛,实现控制空间机械臂完成特定目标,并且有效降低抖动现象,提升控制的稳定性。
【文章页数】:6 页
【文章目录】:
0 引言
1 PPO算法
2 基于PPO的控制算法
2.1 系统组成
2.2 训练环境
2.3 基于PPO的控制决策算法
3 仿真校验
4 结论
本文编号:3797559
【文章页数】:6 页
【文章目录】:
0 引言
1 PPO算法
2 基于PPO的控制算法
2.1 系统组成
2.2 训练环境
2.3 基于PPO的控制决策算法
3 仿真校验
4 结论
本文编号:3797559
本文链接:https://www.wllwen.com/kejilunwen/hangkongsky/3797559.html