当前位置:主页 > 科技论文 > 自动化论文 >

基于视觉的未知物体识别及机器人自主抓取研究

发布时间:2020-04-08 23:27
【摘要】:随着机器人技术和信息技术的不断发展,基于视觉的未知物体识别技术和机器人自主抓取技术作为机器人为人类提供自主抓取服务任务的基本能力,越来越受到相关领域研究者的重视。该技术可被广泛应用在辅助医疗、智能家居、智慧工厂等诸多领域,从而极大扩展机器人的应用范围和应用前景。然而,相对于实验室环境下的机器人未知物体识别和自主抓取研究,在真实环境下,机器人面临着背景环境复杂,物体模型未知及人类个体行为间差异性大等众多严峻挑战。因此,如何使机器人在真实环境中,依据人类典型行为的识别理解,主动抓取目标物体,完成为人类提供自主抓取服务是一个需要克服的难题。机器人准确实现对未知物体的识别和对人类日常生活中一些典型抓放行为的有效识别,是其能够完成自主抓取任务的核心能力。其中未知物体识别为机器人自主抓取任务提供抓取决策能力,完成对物体可抓取性判断,对可抓取物体种类识别和对物体抓取区域识别。人类抓放行为识别为机器人自主抓取任务提供上层决策能力,实现对人类典型抓取、放置和移动物体行为的有效识别。本文采用3D视觉传感器作为机器人主要的感知工具,主要研究人机协作背景下,机器人完成自主抓取物体任务中关键的视觉识别问题,并将其划分为三个关键问题:真实环境中适合抓取物体的识别问题,未知模型物体抓取区域的识别问题,以及不完整数据序列下人类抓放行为的识别问题。首先,人类抓放行为识别部分为机器人自主抓取任务提供抓取目标;然后,可抓取物体识别部分检测识别出适合机器人进行抓取的目标物体;最后,未知模型物体抓取区域识别部分获取目标物体的抓取区域及抓取位姿,并生成机器人的抓取规划。本文将对上述三个关键的视觉识别问题展开研究。针对训练数据不足情况下,传统可抓取物体识别方法识别效果差、泛化能力不足的问题,本文提出一种基于分等级特征-多任务学习机制的可抓取物体识别方法。首先,采用基于浅层核特征和自学习特征的分等级特征学习方法,从有限训练数据中高效的学习物体高等级图像特征描述;然后,将可抓取物体识别问题分解为物体可抓取性判别和可抓取物体种类识别两个子任务,并构建一个由粗到细的多任务学习机制;最后,设计一种多任务损失函数对两个识别任务同时进行约束,实现对多任务模型的联合优化。其中物体可抓取性判别结果是物体抓取区域识别的前提条件,而可抓取物体种类识别结果则可识别出目标种类物体所在区域。实验结果表明,该方法能够实现对可抓取物体快速、准确的识别分类,并在真实环境中取得良好的识别效果。针对机器人对未知模型物体的抓取识别问题,本文提出一种基于深度卷积神经网络结构的物体抓取区域识别方法。该方法无需建立物体模型,可通过物体一对RGB-D图像信息,识别出适合机器人抓取的物体区域及抓取位姿。首先,将机器人对物体的抓取问题形式化为一个对图像中抓取区域的识别问题,并采用深度卷积神经网络模型来解决这一问题;然后,为了提高模型对多通道信息的处理能力,设计一种多通道视觉信息融合方法,显著降低模型过拟合风险;其后,采用一种基于反馈机制的候选抓取区域生成算法,对物体上输出概率最大化的抓取区域实现快速搜索;最后,对抓取区域的六自由度位姿进行有效估计,并生成机器人的期望抓取位姿。实验结果表明,该方法在真实环境下对未知模型物体的抓取识别效果优异,验证了方法的有效性和强泛化能力。人类行为是一种具有高度不确定性的时序信息,由于人类个体习惯不同,即使同一类别的人类行为也差异巨大。为了从不完整图像序列信息中实现对人类抓放行为中典型抓取、放置和移动行为的有效识别,本文提出一种基于改进循环卷积神经网络结构的人类抓放行为识别方法。首先,将人类抓放行为的识别问题形式化为一个可端到端训练的编码-解码问题;然后,通过卷积网络模型和长短期记忆模型学习表征人类抓放行为空间信息和时序信息的抽象特征;其后,通过改进模型损失函数处理人类抓放行为图像序列信息初始阶段的高噪声和歧义性问题,并使模型能够利用不完整序列信息,尽早完成对人类抓放行为的识别;最后,通过大量采样数据样本、合理的数据放大及设计模型训练步骤,实现对模型的训练优化。实验结果表明,该方法对噪声不敏感、鲁棒性强,能够实现对人类抓放行为中抓取、放置和移动物体行为的有效识别。本文搭建机器人自主抓取实验平台,设计依据人类抓放行为识别结果的机器人自主抓取策略,并开展机器人抓取未知模型物体实验和有人类参与的机器人自主抓取实验。实验结果表明,机器人可在真实环境下实现对未知模型物体的有效抓取,且机器人可依据人类抓放行为意图的识别结果做出抓取决策,完成对目标物体的自主抓取任务。
【图文】:

神经网络模型,偏置


第 1 章 绪论一个典型的传统神经网络主要包括输入层(蓝色)、隐含层(绿色)和输出层(红色)等三个层级,如图1-1所示。图中神经网络结构包含 4 个输入单元(不包含偏置项),3 个隐含单元(不包含偏置项)和 1 个输出单元,其中隐含层单元数量为模型超参数,需要进行调节以获取最佳识别效果。图 1-1 传统的神经网络模型Fig.1-1 The model of traditional neural networks图中各神经元之间的连接线代表模型权重参数,包括[1] [1] [2] [2],其中[ ]向量中各项[ ]表示第 层上第 单元与第 层上第 个单元间的连接权重参数;[ ]向量中各项[ ]是第 层与第 层上第 个神经元上的偏置项参数。图中[2]和[2]分别表示隐含神经元的加权总输入向量和激活向量;是神经网络的第 个输出单元的输出结果。通过将参数矩阵进行向量化,神经网络前向传播阶段的计算过程可简化为下式。[2]∑1[1][1] [1] [1][2] [2][3] [2] [2] [2][3] [3](1-2)式中 ———表示激活函数;1———表示输入单元维度。设定神经网络模型样本集为(1) (1) ( ) ( ),则上述神经网络模型的损失函数如式1-3所示。式中第一项为模型的均方差项

自编码,神经网络结构


解决这一问题的典型方法。该方法通过一种最小解释路径的三层神经网络来构建一个恒等式,以实现对输入数据的重构,,从而完成对输入特征的等效变换。该方法模型结构如图1-2所示。图 1-2 自编码神经网络结构Fig.1-2 The model of an auto-encoder图1-2中,1 2,[ ][ ]1[ ]2[ ]和1 2分别为网络输入单元、隐含层单元和输出单元;[ ]和[ ]分别为隐含层的输入和输- 8 -
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TP242

【参考文献】

相关期刊论文 前1条

1 赵丽琴;韩赞勇;;人口老龄化背景下我国经济发展问题研究[J];经济问题;2015年10期

相关硕士学位论文 前1条

1 李重阳;基于在线避障的机器人示范编程技术研究[D];哈尔滨工业大学;2015年



本文编号:2619959

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2619959.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户db078***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com