基于强化学习空间机械臂智能捕获控制策略研究
发布时间:2021-06-30 15:45
随着社会的发展对航天器的需求日益增加,在轨运行的航天器数目越来越多,在轨服务技术将充分展现其战略军事价值和显著民用经济效益。捕获空间目标是空间机械臂在执行各种在轨服务任务中至关重要的环节,然而空间机械臂系统动力学特性复杂,难以建立精确的动力学模型,导致控制系统难以实现较好的控制效果。目前,随着人工智能技术的不断发展,依靠数据驱动的智能控制算法相继被提出,具有无需对系统进行数学建模的特点。因此,本文将强化学习方法应用在空间机械臂捕获过程控制中,分别提出深度强化学习捕获控制方法和基于模型强化学习控制方法。论文完成的主要工作及获得的结论如下:首先,建立了空间机械臂的虚拟仿真环境。以空间机械臂捕获漂浮目标作为研究任务,在V-rep仿真平台中建立空间机械臂仿真环境,用于强化学习训练以及进行动力学仿真分析;并设计一种传统捕获控制方法,并进行仿真分析,用于与基于强化学习捕获控制方法进行比较;然后,提出深度强化学习捕获控制方法。采用“预训练”思想并基于深度确定性策略方法设计捕获控制方法,在仿真环境中训练实现了对空间目标的捕获任务;同时与无“预训练”环节的捕获控制方法比较,“预训练”表现出在训练阶段能够...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
加拿大机械臂
腕关节 俯仰/偏航/滚转肘关节 俯仰肩关节 俯仰/偏航旋转手控制器 俯仰/偏航/滚转移动手控制器 左/右/上/下/前/后控制 自动控制或宇航员控制2001 年 4 月发射升空并成功安装在国际空间站( International Sn, ISS)上的加拿大臂-2(Canadarm2)是空间站遥操作系统的别称 设计制造,是迄今为止在轨服务的最尖端的空间机器人系统,如图 1。Canadarm2 是 CSA 为 ISS 设计制造的移动维护系统(Mobile Sem, MSS)三个组成部分中的一个,另两个系统为专用灵巧机械手(Spose Dexterous Manipulator, RMS )和移动基座( Mobile Base Sy)。各分系统的作用与功能如下:MBS 是 Canadarm2 的基座平台,如图 1-2 所示,安装在能使它沿着架的轨道运动的移动传送器上,当加拿大臂 2 安装在基座上时,它/s 的最高速度移动至空间站衍架的任何一点。MBS 为宇航员进行,提供了活动空间以及安全保障。
图 1-3 专用灵巧机械手SRMS 与 Canadarm 有诸多相似之处,但比后者要先进很多,主要包点:(1) 承载能力大,可以移动重达 100 吨的物体,可以实现大吨转运;(2) 位置控制精度较高,在无负载时,能自动移动到距目标mm 的范围内,而 Canadarm 的精度是±152mm;(3) 具有力矩测量功能轨操作力矩大小;(4) 具有基本的避撞以及捕获慢速移动目标的功能S 的主要特性见表 1-2。表 1-2 SSRMS 主要参数主要特性 参数长度 17.7m自重 1800kg直径 350mm最大负载 116,000Kg抓取的目标特性 相对静止或相对慢速移动控制方式 宇航员控制、自动控制传感器 光电码盘、力、力矩传感器控制精度 ±64mm其他特征 内置冗余、空间可修复、防撞
【参考文献】:
期刊论文
[1]多臂空间机器人的视觉伺服与协调控制[J]. 冯骁,卢山,侯月阳,王奉文,贾英宏. 宇航学报. 2018(02)
[2]空间机械臂手系统在轨精细维修操作的标定策略[J]. 刘冬雨,刘宏,李志奇. 宇航学报. 2017(06)
[3]漂浮基空间机械臂捕获卫星过程的碰撞冲击效应评估与镇定运动的RBF神经网络控制[J]. 董楸煌,陈力. 机器人. 2013(06)
[4]载人航天器柔性机械臂的动力学建模方法[J]. 刘志全,危清清,王耀兵. 航天器工程. 2013(05)
[5]捕获非合作目标后航天器的自主稳定技术研究[J]. 韦文书,荆武兴,高长生. 航空学报. 2013(07)
[6]基于混合规划策略的空间机械臂运动规划研究[J]. 廖一寰,李道奎,唐国金. 宇航学报. 2011(01)
[7]空间机器人目标捕获过程中碰撞运动分析[J]. 陈钢,贾庆轩,孙汉旭,洪磊. 机器人. 2010(03)
[8]双臂式空间机械臂捕捉目标问题[J]. 丛佩超,孙兆伟. 上海交通大学学报. 2009(11)
[9]漂浮基空间机械臂基于双向映射神经元网络的逆运动学控制[J]. 黄登峰,陈力. 应用力学学报. 2009(02)
[10]多体系统动力学碰撞问题研究综述[J]. 董富祥,洪嘉振. 力学进展. 2009(03)
博士论文
[1]空间机械臂在轨捕获碰撞动力学及控制研究[D]. 张龙.北京邮电大学 2017
[2]在轨服务空间机器人机械多体系统动力学高效率建模研究[D]. 田富洋.南京航空航天大学 2009
本文编号:3258029
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
加拿大机械臂
腕关节 俯仰/偏航/滚转肘关节 俯仰肩关节 俯仰/偏航旋转手控制器 俯仰/偏航/滚转移动手控制器 左/右/上/下/前/后控制 自动控制或宇航员控制2001 年 4 月发射升空并成功安装在国际空间站( International Sn, ISS)上的加拿大臂-2(Canadarm2)是空间站遥操作系统的别称 设计制造,是迄今为止在轨服务的最尖端的空间机器人系统,如图 1。Canadarm2 是 CSA 为 ISS 设计制造的移动维护系统(Mobile Sem, MSS)三个组成部分中的一个,另两个系统为专用灵巧机械手(Spose Dexterous Manipulator, RMS )和移动基座( Mobile Base Sy)。各分系统的作用与功能如下:MBS 是 Canadarm2 的基座平台,如图 1-2 所示,安装在能使它沿着架的轨道运动的移动传送器上,当加拿大臂 2 安装在基座上时,它/s 的最高速度移动至空间站衍架的任何一点。MBS 为宇航员进行,提供了活动空间以及安全保障。
图 1-3 专用灵巧机械手SRMS 与 Canadarm 有诸多相似之处,但比后者要先进很多,主要包点:(1) 承载能力大,可以移动重达 100 吨的物体,可以实现大吨转运;(2) 位置控制精度较高,在无负载时,能自动移动到距目标mm 的范围内,而 Canadarm 的精度是±152mm;(3) 具有力矩测量功能轨操作力矩大小;(4) 具有基本的避撞以及捕获慢速移动目标的功能S 的主要特性见表 1-2。表 1-2 SSRMS 主要参数主要特性 参数长度 17.7m自重 1800kg直径 350mm最大负载 116,000Kg抓取的目标特性 相对静止或相对慢速移动控制方式 宇航员控制、自动控制传感器 光电码盘、力、力矩传感器控制精度 ±64mm其他特征 内置冗余、空间可修复、防撞
【参考文献】:
期刊论文
[1]多臂空间机器人的视觉伺服与协调控制[J]. 冯骁,卢山,侯月阳,王奉文,贾英宏. 宇航学报. 2018(02)
[2]空间机械臂手系统在轨精细维修操作的标定策略[J]. 刘冬雨,刘宏,李志奇. 宇航学报. 2017(06)
[3]漂浮基空间机械臂捕获卫星过程的碰撞冲击效应评估与镇定运动的RBF神经网络控制[J]. 董楸煌,陈力. 机器人. 2013(06)
[4]载人航天器柔性机械臂的动力学建模方法[J]. 刘志全,危清清,王耀兵. 航天器工程. 2013(05)
[5]捕获非合作目标后航天器的自主稳定技术研究[J]. 韦文书,荆武兴,高长生. 航空学报. 2013(07)
[6]基于混合规划策略的空间机械臂运动规划研究[J]. 廖一寰,李道奎,唐国金. 宇航学报. 2011(01)
[7]空间机器人目标捕获过程中碰撞运动分析[J]. 陈钢,贾庆轩,孙汉旭,洪磊. 机器人. 2010(03)
[8]双臂式空间机械臂捕捉目标问题[J]. 丛佩超,孙兆伟. 上海交通大学学报. 2009(11)
[9]漂浮基空间机械臂基于双向映射神经元网络的逆运动学控制[J]. 黄登峰,陈力. 应用力学学报. 2009(02)
[10]多体系统动力学碰撞问题研究综述[J]. 董富祥,洪嘉振. 力学进展. 2009(03)
博士论文
[1]空间机械臂在轨捕获碰撞动力学及控制研究[D]. 张龙.北京邮电大学 2017
[2]在轨服务空间机器人机械多体系统动力学高效率建模研究[D]. 田富洋.南京航空航天大学 2009
本文编号:3258029
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3258029.html