学习人类策略在机械臂的应用研究
发布时间:2017-11-20 20:32
本文关键词:学习人类策略在机械臂的应用研究
更多相关文章: 运动学 人类学系策略 极限学习机 自治动态系统 稳定性
【摘要】:本课题面向日益增长的服务机器人研发需求,尤其是服务机器人中的所需的机械臂,利用学习人类控制策略进行智能控制技术的研究。本文首先介绍机械臂的基础运动学控制,并提出一种机器人模仿系统。通过正向运动学,机械臂能够从关节角计算出末端位置,通过反向运动学,又能够计算出合适的关节角以期到达设定的末端位置。通过捕捉系统,如Kinect,在得到人体运动信息的基础上,模仿系统将人运动映射到机器人的关节角,从而使得机器人能够实时模仿人运动。机器人模仿系统只是尽量精确地复制人的运动,学习人类控制策略引入学习的方法提取运动策略。其一般划分为三阶段:示例阶段,学习阶段和复制阶段。在示例阶段,人类导师主动地控制机器人完成一些运动,并将运动中机器人的状态变量存储起来。学习阶段通过机器学习的方法,从示例中学习一个控制模型,该模型需要具有泛化能力。当机器人遇到不同的场景时,复制阶段利用学习到的模型得到一个具有相似特征的轨迹。同时我们还需要考虑鲁棒性问题,即学习到的轨迹具有稳定性,总是能够到达特定的目标点。本文的算法是基于极限学习机,通过将机械臂点到点的运动建模为自治动态系统,即不显含时间变量的动态方程,并利用该方法进行学习。在给定初始点和目标点的基础上,算法利用数值积分完成复制阶段的轨迹生成。我们通过李雅普诺夫控制理论推导出能够使该系统具有全局和局部渐进稳定的约束条件,并将这些条件加入到基于优化的学习中去。该系统结构简单,易于实现,且能取得很好的泛化性和鲁棒性。我们实现该系统,并在数据集上进行模拟和在Nao机器人上进行实验。模拟和实验结果能充分验证学习到的系统的稳定性,而且对于时间扰动和空间扰动,该系统都能有很好的鲁棒性。
【学位授予单位】:中国科学院深圳先进技术研究院
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP241
【参考文献】
中国博士学位论文全文数据库 前1条
1 金卓军;逆向增强学习和示教学习算法研究及其在智能机器人中的应用[D];浙江大学;2011年
,本文编号:1208451
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1208451.html