当前位置:主页 > 科技论文 > 航空航天论文 >

基于强化学习的空间机械臂控制方法

发布时间:2023-04-22 11:33
  针对现有空间机械臂控制方法在实际应用中调试时间长、稳定性差的问题,提出一种基于深度强化学习的控制算法。构建仿真环境用于产生数据,通过状态变量实现仿真环境与深度强化学习算法的交互,通过奖励函数实现对神经网络参数的训练,最终实现使用近端策略优化算法(Proximal Policy Optimization,PPO)控制空间机械臂将抓手移动至物体下方特定位置的目的。实验结果表明,本文提出的控制算法能够快速收敛,实现控制空间机械臂完成特定目标,并且有效降低抖动现象,提升控制的稳定性。

【文章页数】:6 页

【文章目录】:
0 引言
1 PPO算法
2 基于PPO的控制算法
    2.1 系统组成
    2.2 训练环境
    2.3 基于PPO的控制决策算法
3 仿真校验
4 结论



本文编号:3797559

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/hangkongsky/3797559.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户14202***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com