当前位置:主页 > 科技论文 > 自动化论文 >

面向机器人运动控制的增量式模仿学习技术研究

发布时间:2020-11-09 09:41
   模仿学习是机器人操作控制中一种常用的学习方式,传统的机器人模仿学习过程针对特定的任务逐一构造运动控制模型进行操作任务模仿,导致模仿学习模型的鲁棒性较差,可移植性较弱。本文提出的机器人增量式模仿学习框架与人类根据自身经验进行累积学习的过程相近,其具备在线迁移已经学习到的知识的能力,而这一能力是机器人通过小样本学习进行大规模的任务操作的重要基础,也是机器人模仿学习的一个重要发展方向。本文主要研究增量式模仿学习问题,它是机器人面向多操作任务进行运动控制与行为决策的基础,本文所提出的模仿学习方法主要分为基于行为克隆的模仿学习和基于逆强化学习的模仿学习。尽管一些现有的方法体现出了模仿学习易于进行机器人动作控制策略学习的优势,但都难以实现在任务数目多、差异大、工作场景动态变化等复杂情况下的机器人模仿学习。因此,本文提出了机器人增量式多任务模仿学习问题,并基于增量式学习框架对该问题进行了深入研究,建立了面向机器人运动控制的增量式模仿学习体系,提出了基于行为克隆DMP的增量式多任务模仿学习和基于逆强化学习IRL的增量式多任务模仿学习算法,并将其分别应用在了末端轨迹模仿和行为动作模仿等机器人模仿学习领域的关键问题中。本文的主要内容如下:首先,提出了面向机器人运动控制的增量式模仿学习问题,从增量式模仿学习的必要性和合理性等方面进行了详细的论述。建立了增量式模仿学习框架,使得机器人可以从之前学习到的运动控制策略中获取到相关的经验知识,并不断的扩充和更新已学习到的知识库,以便实现在线的多任务模仿学习。其次,分别以基于行为克隆的模仿学习方法DMP和基于逆强化学习的模仿学习方法IRL为例,研究了增量式学习框架在机器人多任务增量式模仿学习问题中的应用。针对基于行为克隆的机器人模仿学习,提出了融合稀疏编码和DMP的增量式轨迹模仿学习框架;针对基于逆强化学习的机器人模仿学习,提出了融合稀疏编码和多意图强化学习的增量式动作策略模仿学习框架。最后,为验证本文所提出的方法的效果,分别在三种仿真平台和实体UR5机械臂实验平台下进行了机器人多操作控制任务模仿学习实验,验证了机器人自主进行在线的新任务模仿学习以及优化和构建模仿学习经验知识库的能力,实现了面向机器人操作控制的增量式多任务模仿学习。
【学位单位】:哈尔滨工业大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP242;TP181
【部分图文】:

示意图,模仿学习,机器人,关键帧


图 1-1 机器人模仿学习系统示意图Fig.1-1 Control diagram of the robot imitation learning研究成果中,机器人一般通过人为操控示教器的方式进行遥教过程中,机器人的位姿信息、环境状态及目标位置等信息数据中可以分割提取出运动轨迹中的多个关键帧,从而使描述一连串关键帧状态的映射策略和在关键帧中间进行转

内容,组织结构


本文的主要研究内容Fig.1-2Themainresearchcontentofthispaper

模仿学习,分层控制,机器人,行为


图 2-1 机器人分层控制模仿学习Fig.2-1 Hierarchical control diagram of the robot imitation learning.3 基于行为克隆的模仿学习在本节中,我们将介绍行为克隆模仿学习(Behavior Clone)方法。行为
【相似文献】

相关期刊论文 前10条

1 姚荣光;;浅谈模仿学习与创新学习的关系[J];现代语文(教学研究版);2010年03期

2 艾诗根;;从复制到创新:学生模仿学习能力提升的策略逻辑[J];教育理论与实践;2018年29期

3 张瑞敏;;中国企业如何从模仿学习到引领创新?[J];企业管理;2017年06期

4 罗艺;;模仿学习与高校诚信教育文献综述[J];青年与社会;2019年17期

5 ;作文选登[J];疯狂英语(小学版);2017年03期

6 周晓丽;;艺术在身边,创意在身边[J];家教世界;2017年15期

7 陈静奋;;观察-模仿学习促我成长[J];幼儿教育;2013年07期

8 李帅龙;张会文;周维佳;;模仿学习方法综述及其在机器人领域的应用[J];计算机工程与应用;2019年04期

9 吴春辉;;碓井诚:中国便利店制造+IT是未来趋势[J];公关世界;2018年11期

10 生润;;浅谈小学英语课堂教学中的模仿学习[J];吉林教育;2010年14期


相关博士学位论文 前2条

1 马乐;基于非接触观测信息的机器人行为模仿学习[D];沈阳工业大学;2014年

2 张海峰;复杂网络上个体的不同行为导致多样的整体行为[D];中国科学技术大学;2011年


相关硕士学位论文 前10条

1 李跃腾;基于生成对抗网络的模仿学习研究[D];哈尔滨工业大学;2019年

2 黄悦;面向机器人运动控制的增量式模仿学习技术研究[D];哈尔滨工业大学;2019年

3 许贞;演示方式对儿童模仿学习的影响研究[D];西北师范大学;2017年

4 陈静奋;实践、反思/团队支持[D];南京师范大学;2012年

5 吕而立(Erli Lyu);基于模仿学习和隐马尔可夫模型的人机交互研究[D];哈尔滨工业大学;2016年

6 孔鑫;基于行为模仿的机器人学习方法的研究[D];河北工业大学;2006年

7 门玉森;基于轨迹匹配的模仿学习在类人机器人运动行为中的研究[D];北京工业大学;2016年

8 徐骢驰;具有模仿学习机制的机械臂系统的研究与实现[D];北京工业大学;2016年

9 匡荣;不同拓扑结构下的复杂网络链路预测研究[D];重庆邮电大学;2017年

10 郑逸加;基于高斯混合模型的模仿学习算法的优化与评价[D];北京工业大学;2017年



本文编号:2876230

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2876230.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cb844***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com