上肢康复机器人的增强学习控制方法研究

发布时间:2017-05-03 04:07

  本文关键词:上肢康复机器人的增强学习控制方法研究,由笔耕文化传播整理发布。


【摘要】:上肢康复机器人是近年来康复机器人研究领域的热点之一。上肢康复机器人因其复杂的动力特性和多变的工作环境,使得它的运动控制设计极具挑战性。为解决这一问题,本文基于自适应评价增强学习算法,提出了几种运动控制算法以解决康复机器人的运动控制问题。主要工作概括如下:(1)针对存在模型参数不确定及外界干扰的上肢康复机器人运动控制问题,基于自适应评价算法设计了上肢康复机器人自适应模糊执行-神经网络评价监督增强学习控制方案。该方案在系统模型参数不确定的情况下,利用方案中的模糊执行器及神经网络评价器逼近康复机器人系统的模型,并结合监督控制器通过序贯决策机制给出一个适宜的控制策略,进而使上肢康复机器人完成期望的运动控制任务且对外界干扰具有很好的鲁棒性。理论分析表明,所构建的运动控制方案是模型参数独立的且不必预知外界干扰的上界。仿真结果证明了所提控制方案的可行性和有效性。(2)针对存在动态不确定性因素(如患肢病情变化、负载扰动等)的上肢康复机器人的鲁棒跟踪控制问题,基于自适应评价算法,设计了上肢康复机器人鲁棒模糊自适应评价控制方案。该方案利用模糊自适应评价控制算法去逼近康复机器人与患肢的接触动力特性并给出一个适宜控制策略,同时该方案还利用鲁棒积分误差反馈控制策略来提高闭环系统的抗干扰能力,从而使系统获得了在治疗目标附近一个较大范围的鲁棒跟踪。理论分析证明了该方案的稳定性与可行性。仿真结果表明了所设计的控制方案能够较好地适应患者患肢病情变化且对负载扰动具有很好的鲁棒性。(3)针对如何实现用最佳的辅助力协同患肢完成期望的训练问题,提出了一种上肢康复机器人自适应评价逆最优混合控制。该方案基于含有患者主动运动意图的康复机器人系统模型,运用自适应评价算法的优化与决策能力并结合PD逆最优控制技术通过寻求一个可以使末态约束目标泛函达到最小的控制策略,进而实现康复机器人的最佳辅助控制。Lyapunov稳定理论证明了该方案的稳定性,最小意义化优化分析了该方案的最优性,仿真及实际实验结果表明了所提方案的可行性与有效性。(4)针对存在参数不确定性、外界干扰及仅有位置可测的上肢康复机器人的运动控制问题,提出了一种基于动态观测器的上肢康复机器人鲁棒最优控制方案。该方案由鲁棒动态观测器、鲁棒自适应逆最优控制器构成。其中鲁棒动态观测器估计康复机器人系统的状态,鲁棒自适应逆最优控制器则基于系统的观测状态通过搜索最佳的训练控制策略以迫使康复机器人完成期望的鲁棒最优跟踪。理论分析表明了该方案的稳定性及优化性。仿真实例表明,即使在模型参数不确定性、外界干扰存在及仅有位置可测的情况下,所提方案也能够保证康复机器人用最佳的辅助力协助患者完成功能性训练控制任务。(5)针对存在模型不确定、外界干扰且带有输入非线性(如执行器饱和特性)的强不确定性上肢康复机器人系统的稳定性和运动的平滑性问题,提出了一种基于控制器切换的鲁棒最优跟踪控制方案。该方案根据系统状态或者训练任务的变化选择相应的饱和控制器输出以获得满意的控制效果。对于重复性训练任务,该方案直接从记忆库中选择控制律,从而消除了系统在重复的运动训练任务发生变化时出现的瞬态误差;对于非重复的新情况(训练任务)该方案则借助于自身的优化与决策能力,通过适当地选择切换规则,完成任意一个训练任务模式下的鲁棒最优控制。理论分析证明了该方案的稳定性与可行性。另外以本实验室构建的上肢康复机器人系统为实验平台,开展了上肢康复机器人增强学习控制方法的实验研究,实验结果表明尽管存在强不确定性及输入非线性,但所提方案不仅可以保证完成期望训练控制任务和运动的平滑性,还可以有效抑制外界干扰,且对模型参数不确定性具有很强的鲁棒性。上述工作和研究成果在上肢康复机器人的运动控制问题及自适应评价控制方法的实际应用方面做了一些有益的探索,为在自适应评价算法框架下最终实现上肢康复机器人的自主运动控制奠定了基础。
【关键词】:上肢康复机器人 运动控制 自适应评价算法 逆最优控制 Lyapunov方法
【学位授予单位】:北京理工大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP242.6
【目录】:
  • 摘要5-7
  • Abstract7-13
  • 第1章 绪论13-29
  • 1.1 本论文研究的目的和意义13-14
  • 1.2 上肢康复机器人国内外研究现状14-17
  • 1.2.1 国外研究现状15-16
  • 1.2.2 国内研究现状16-17
  • 1.3 国内外上肢康复机器人运动控制研究现状17-25
  • 1.3.1 研究中存在的问题17-19
  • 1.3.2 经典控制方法19-20
  • 1.3.3 智能控制方法20-22
  • 1.3.4 增强学习方法22-24
  • 1.3.5 其他控制方法应用24-25
  • 1.4 论文主要研究内容25-28
  • 1.5 本章小结28-29
  • 第2章 上肢康复机器人的运动控制问题及改进的自适应评价增强学习算法29-49
  • 2.1 引言29-31
  • 2.2 系统模型及性质31-32
  • 2.3 上肢康复机器人的运动控制问题32-33
  • 2.4 康复机器人运动控制技术难点33-37
  • 2.4.1 运动控制技术难点33-34
  • 2.4.2 自适应评价增强学习算法在运动控制中的应用难点34-37
  • 2.5 模糊执行-神经评价监督增强学习控制37-41
  • 2.5.1 监督控制器37-38
  • 2.5.2 模糊逻辑执行器38-39
  • 2.5.3 神经网络评价器39-41
  • 2.6 稳定性分析41-42
  • 2.7 仿真实例42-48
  • 2.8 本章小结48-49
  • 第3章 具有不确定性因素的上肢康复机器人鲁棒跟踪控制49-67
  • 3.1 引言49-50
  • 3.2 系统模型及性质50-52
  • 3.3 控制目标52
  • 3.4 控制器设计52-58
  • 3.4.1 模糊逻辑执行器53-56
  • 3.4.2 模糊逻辑评价器56-58
  • 3.5 稳定性分析58-60
  • 3.6 仿真实例60-66
  • 3.6.1 被动运动模式下的轨迹跟踪60-63
  • 3.6.2 主动抗阻训练模式下的轨迹跟踪63-66
  • 3.7 本章小结66-67
  • 第4章 上肢康复机器人自适应评价逆最优混合控制67-91
  • 4.1 引言67-69
  • 4.2 问题描述69-71
  • 4.3 控制目标71-72
  • 4.4 控制器设计72-76
  • 4.4.1 神经网络执行器72-75
  • 4.4.2 神经网络评价器75-76
  • 4.5 稳定性分析76-79
  • 4.6 优化分析79-81
  • 4.7 实验与仿真81-89
  • 4.7.1 仿真81-86
  • 4.7.2 应用实例86-89
  • 4.8 本章小结89-91
  • 第5章 基于动态观测器的上肢康复机器人鲁棒最优跟踪控制91-113
  • 5.1 引言91-92
  • 5.2 系统模型92-93
  • 5.3 控制目标及问题描述93-94
  • 5.4 控制器设计94-101
  • 5.4.1 鲁棒神经-模糊执行器95-97
  • 5.4.2 鲁棒神经-模糊评价器97-98
  • 5.4.3 鲁棒动态神经-模糊观测器98-101
  • 5.5 稳定性分析101-104
  • 5.6 优化分析104-106
  • 5.7 仿真实验106-111
  • 5.7.1 存在常干扰时的轨迹跟踪107-108
  • 5.7.2 存在时变干扰时的轨迹跟踪108-111
  • 5.8 本章小结111-113
  • 第6章 基于控制器切换的上肢康复机器人鲁棒最优跟踪控制及实验研究113-147
  • 6.1 引言113-114
  • 6.2 混杂系统模型及问题描述114-117
  • 6.3 控制目标117-118
  • 6.4 控制器设计118-122
  • 6.4.1 多神经网络执行器118-121
  • 6.4.2 多神经网络评价器121-122
  • 6.5 稳定性分析122-126
  • 6.6 优化分析126-128
  • 6.7 仿真实例128-137
  • 6.8 实际实验验证137-146
  • 6.8.1 实验系统138-140
  • 6.8.2 实验控制系统140
  • 6.8.3 实验内容140-141
  • 6.8.4 实验过程141-142
  • 6.8.5 实验结果与讨论142-146
  • 6.9 本章小结146-147
  • 结论与展望147-151
  • 参考文献151-171
  • 攻读学位期间发表论文与研究成果清单171-173
  • 致谢173-175
  • 作者简介175

【共引文献】

中国期刊全文数据库 前10条

1 张雷;周宛松;卢磊;樊成;;抛光力实时控制策略研究[J];东北大学学报(自然科学版);2015年06期

2 张付祥,付宜利,王树国;康复机器人研究进展[J];河北工业科技;2005年02期

3 付宜利;甘增康;张福海;张勤超;;基于患者表现逐步辅助的康复机械手控制系统设计[J];机械与电子;2011年08期

4 刘德荣;李宏亮;王鼎;;基于数据的自学习优化控制:研究进展与展望[J];自动化学报;2013年11期

5 崔黎黎;刘杰;张勇;;基于单网络ADP的一类未知非线性系统的近似最优控制[J];控制与决策;2013年09期

6 Xiao-hua WANG;Juan-juan YU;Yao HUANG;Hua WANG;Zhong-hua MIAO;;Adaptive dynamic programming for linear impulse systems[J];Journal of Zhejiang University-Science C(Computers and Electronics);2014年01期

7 陈学松;刘富春;;一类非线性动态系统基于强化学习的最优控制[J];控制与决策;2013年12期

8 谭拂晓;刘德荣;关新平;罗斌;;基于微分对策理论的非线性控制回顾与展望[J];自动化学报;2014年01期

9 SONG RuiZhuo;XIAO WenDong;SUN ChangYin;;A new self-learning optimal control laws for a class of discrete-time nonlinear systems based on ESN architecture[J];Science China(Information Sciences);2014年06期

10 金玉净;朱文文;伏玉琛;刘全;;基于Tile Coding编码和模型学习的Actor-Critic算法[J];计算机科学;2014年06期

中国博士学位论文全文数据库 前10条

1 边辉;生物融合式康复机构理论与应用研究[D];燕山大学;2011年

2 张付祥;创伤手指康复机械手系统研究[D];哈尔滨工业大学;2007年

3 王鹏;手指创伤功能康复机械手系统研究[D];哈尔滨工业大学;2009年

4 杜义浩;并联机器人轨迹规划中的运动误差补偿方法研究[D];燕山大学;2012年

5 叶锦华;不确定非完整轮式移动机器人的运动控制研究[D];华南理工大学;2013年

6 洪昭斌;漂浮基刚、柔混合空间机器人系统智能控制研究[D];福州大学;2011年

7 陈启丽;递归神经网络结构设计方法及应用研究[D];北京工业大学;2014年

8 方啸;GrHDP算法的研究及其在虚拟交互中的应用[D];燕山大学;2014年

9 李醒;五自由度上肢康复机器人训练系统的研究[D];东北大学;2012年

10 崔黎黎;基于神经网络的近似动态规划理论及其应用研究[D];东北大学;2011年

中国硕士学位论文全文数据库 前10条

1 刘倩倩;多功能护理床的结构设计与力学分析[D];中国地质大学(北京);2011年

2 吴希瑶;下肢康复机器人机构分析与设计[D];北京工业大学;2011年

3 孔祥战;仿生外骨骼式下肢康复机器人研究[D];河北工业大学;2011年

4 甄红卫;脚踏车式下肢康复训练器设计及研究[D];燕山大学;2012年

5 黄旭;全方位移动下肢康复机器人无线监控系统研究[D];沈阳工业大学;2012年

6 于海波;并联式踝关节康复机器人系统设计[D];燕山大学;2006年

7 王海滨;四自由度机器人机械系统的研究[D];哈尔滨工业大学;2006年

8 薄少军;中型喷浆机器人动力学研究[D];山东科技大学;2006年

9 李丹;踝关节融合康复机器人系统的轨迹规划和运动控制[D];燕山大学;2008年

10 罗延军;基于上肢康复机器人的仿生机构模型研究[D];沈阳工业大学;2009年


  本文关键词:上肢康复机器人的增强学习控制方法研究,由笔耕文化传播整理发布。



本文编号:342277

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/342277.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户06c65***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com