基于优化ResNet结构的机器人抓取算法研究
发布时间:2021-03-04 18:04
机器人技术是跨越传统工程界线的相对较新的现代技术,它的出现大大地提高了社会生产力。抓取是机器人走进真实世界必不可少的一个功能。对于人类来说,识别和抓取物体是一项比较简单的任务。但对于机器人来说,识别和抓取物体是一项非常具有挑战性的任务,涉及到目标检测、抓取位姿判别、机械臂的运动规划与控制等内容。随着卷积神经网络(CNN)模型在很多应用领域展现出优异的效果,越来越多的学者开始关注基于卷积神经网络模型的研究。神经网络模型的规模过大,会造成网络不工作或者会出现过拟合问题,也会产生计算代价过高、连接数量冗余大等问题。因此需要对神经网络模型进行优化。本文提出了一种基于基于优化ResNet-50结构的机器人抓取位姿检测算法,并在仿真环境里进行了实验来对算法进行验证。首先,本文建立了机器人抓取系统框架,框架分为三个部分:目标感知、位姿检测和抓取执行。介绍了深度图像的获取方式,深度相机测距原理,针孔成像原理,以及深度相机拍摄得到的彩色图像空间和深度图像空间之间的映射关系。建立了物体抓取位姿表示方法,研究了图像的像素坐标系与机器人基坐标系之间的坐标转换关系。其次,本文对神经网络模型中的基本单元进行了介绍...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
机器人场景识别系统结构
哈尔滨工业大学工学硕士学位论文-4-早使用深度神经网络模型的目标检测算法是R-CNN(Region-basedCNN),但是由于R-CNN算法是由两步完成的以及参数很多,导致计算量很大,所以运算很慢无法到达实时性要求[11];另一方面由于网络模型中存在全连接层,因此对网络模型输入的数据会有限制,这也影响了输出结果。因为R-CNN算法的一些缺陷,SPPNet算法出现了,它是由何恺明等人提出的。该网络应用空间金字塔池化的方法成功地解决了R-CNN算法对输入层尺寸要求固定的问题,从而使得网络的输入尺寸灵活[11]。但是SPPNet算法的计算量还是很大,还是不能满足实时性等要求。于是,FastR-CNN算法出现了,大大的增加了网络的计算速度,主要解决了SPPNet算法和R-CNN算法会有大量的计算重复这个问题。但是FastR-CNN算法的预测时间还是太长,依然不能满足实时性等要求。接着,FasterR-CNN算法又出现了,FasterR-CNN算法的结构示意图如图1-3所示,将预测所用的时间大大降低了[12]。但是FasterR-CNN算法还是不能满足实时性等要求。图1-3FasterR-CNN架构图[6]上面的R-CNN、SPPNet、FastR-CNN和FasterR-CNN这类的目标检测算法都是基于区域生成方法的,而接下来介绍的YOLO[13]是基于回归方法的检测算法。YOLO是端到端的目标检测算法,一次只用训练一个网络即可,大大地增加了网络的预测速度,但是损失了一点预测准确度。YOLOv3是YOLO目前最新的版本,在当前所有的基于深度学习的目标检测算法中,它是最快的,且它的预测准确度也不差,实时性要求也能满足。YOLOv3性能与其他算法比较如图1-4所示。
哈尔滨工业大学工学硕士学位论文-5-图1-4YOLOv3同其他算法性能比较[11]在2016年Liu等人提出了SSD算法,其主要引用了YOLOv2的回归思想以及FasterR-CNN的锚框机制[11]。SSD算法使用了卷积输出、残差单元和多尺度预测,预测的精度和速度都有所保证。1.3.3机器人抓取机器人技术越来越多的应用到人类生活的方方面面,在所有机器人应用中,抓取是基本且十分重要的,因为它会为社会带来巨大的生产力。在早期,机械臂不具备感知能力,而是通过手动控制机械臂来操作机械手进行抓龋后来,借助诸如数据手套之类的触觉传感器,机器人可以通过应对人的手的行为来进行抓龋这两种方法仍然依靠人工方式,并且缺乏智能。随着光学传感器的发展,机器人已经能够通过基于视觉的感知系统自动进行抓龋但是目前机器人抓取技术在工业上的应用只是通过简单的定位来进行抓龋由于各种条件的限制,机器人抓取技术总体上尚未成熟,大部分还处于实验研究阶段[14]。而且很多研究也只是对视野范围内的单个物体进行抓取,对多个物体的抓取研究还比较少,这种抓取的智能化程度还远远达不到人类的需求。为了提高机器人抓取的智能化水平,很多学者开始研究将在机器人抓取中使用深度学习技术[15]。具有二维或三维图像输入的深度学习网络模型被提出,对目标物体位置的获取也越来越准确,极大地促进了机器人抓取的进步。Yavsan等人提出一个基于动作的控制方法,用深度相机来实时识别和模仿人体上肢运动。这个过程类似目前很火热的主从控制机器人技术,首先是深度
【参考文献】:
期刊论文
[1]深度学习在智能机器人中的应用研究综述[J]. 龙慧,朱定局,田娟. 计算机科学. 2018(S2)
[2]机械臂抓取行为规划研究综述[J]. 韩丽丽,王奇志,杨永刚. 计算机与现代化. 2018(09)
[3]自动驾驶仿真系统中网络安全测试方法研究[J]. 罗璎珞,石娟. 摩托车技术. 2018(06)
[4]基于神经网络的机械臂的模仿学习研究[J]. 于建均,徐骢驰,阮晓钢,门玉森. 控制工程. 2017(11)
[5]非线性最优机器人手眼标定[J]. 王君臣,王田苗,杨艳,胡磊. 西安交通大学学报. 2011(09)
硕士论文
[1]连续空间下基于面部图像的情感分析方法研究[D]. 刘磊.西安理工大学 2019
[2]基于FPGA的复合卷积神经网络算法加速设计[D]. 肖扬.西安理工大学 2019
[3]基于人工神经网络的中外合作办学专业高考分数线预测研究[D]. 吴凯.江西财经大学 2019
[4]基于卷积神经网络的机器人抓取位姿自主检测算法研究[D]. 周彪.华中科技大学 2019
[5]基于深度图像和深度学习的机器人抓取检测算法研究[D]. 王斌.浙江大学 2019
[6]基于双流卷积神经网络的监控视频中打斗行为识别研究[D]. 高阳.西安理工大学 2018
[7]基于深度学习的物体检测和抓取技术研究[D]. 夏壮.哈尔滨工业大学 2018
[8]基于深度学习的机器人抓取仿真训练技术研究[D]. 柳俊先.哈尔滨工业大学 2018
[9]基于模型学习和线性二次型最优控制的机械臂控制器设计[D]. 于程隆.哈尔滨工业大学 2018
[10]基于深度学习的短视频内容分析算法研究[D]. 李夏南.哈尔滨工业大学 2018
本文编号:3063654
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
机器人场景识别系统结构
哈尔滨工业大学工学硕士学位论文-4-早使用深度神经网络模型的目标检测算法是R-CNN(Region-basedCNN),但是由于R-CNN算法是由两步完成的以及参数很多,导致计算量很大,所以运算很慢无法到达实时性要求[11];另一方面由于网络模型中存在全连接层,因此对网络模型输入的数据会有限制,这也影响了输出结果。因为R-CNN算法的一些缺陷,SPPNet算法出现了,它是由何恺明等人提出的。该网络应用空间金字塔池化的方法成功地解决了R-CNN算法对输入层尺寸要求固定的问题,从而使得网络的输入尺寸灵活[11]。但是SPPNet算法的计算量还是很大,还是不能满足实时性等要求。于是,FastR-CNN算法出现了,大大的增加了网络的计算速度,主要解决了SPPNet算法和R-CNN算法会有大量的计算重复这个问题。但是FastR-CNN算法的预测时间还是太长,依然不能满足实时性等要求。接着,FasterR-CNN算法又出现了,FasterR-CNN算法的结构示意图如图1-3所示,将预测所用的时间大大降低了[12]。但是FasterR-CNN算法还是不能满足实时性等要求。图1-3FasterR-CNN架构图[6]上面的R-CNN、SPPNet、FastR-CNN和FasterR-CNN这类的目标检测算法都是基于区域生成方法的,而接下来介绍的YOLO[13]是基于回归方法的检测算法。YOLO是端到端的目标检测算法,一次只用训练一个网络即可,大大地增加了网络的预测速度,但是损失了一点预测准确度。YOLOv3是YOLO目前最新的版本,在当前所有的基于深度学习的目标检测算法中,它是最快的,且它的预测准确度也不差,实时性要求也能满足。YOLOv3性能与其他算法比较如图1-4所示。
哈尔滨工业大学工学硕士学位论文-5-图1-4YOLOv3同其他算法性能比较[11]在2016年Liu等人提出了SSD算法,其主要引用了YOLOv2的回归思想以及FasterR-CNN的锚框机制[11]。SSD算法使用了卷积输出、残差单元和多尺度预测,预测的精度和速度都有所保证。1.3.3机器人抓取机器人技术越来越多的应用到人类生活的方方面面,在所有机器人应用中,抓取是基本且十分重要的,因为它会为社会带来巨大的生产力。在早期,机械臂不具备感知能力,而是通过手动控制机械臂来操作机械手进行抓龋后来,借助诸如数据手套之类的触觉传感器,机器人可以通过应对人的手的行为来进行抓龋这两种方法仍然依靠人工方式,并且缺乏智能。随着光学传感器的发展,机器人已经能够通过基于视觉的感知系统自动进行抓龋但是目前机器人抓取技术在工业上的应用只是通过简单的定位来进行抓龋由于各种条件的限制,机器人抓取技术总体上尚未成熟,大部分还处于实验研究阶段[14]。而且很多研究也只是对视野范围内的单个物体进行抓取,对多个物体的抓取研究还比较少,这种抓取的智能化程度还远远达不到人类的需求。为了提高机器人抓取的智能化水平,很多学者开始研究将在机器人抓取中使用深度学习技术[15]。具有二维或三维图像输入的深度学习网络模型被提出,对目标物体位置的获取也越来越准确,极大地促进了机器人抓取的进步。Yavsan等人提出一个基于动作的控制方法,用深度相机来实时识别和模仿人体上肢运动。这个过程类似目前很火热的主从控制机器人技术,首先是深度
【参考文献】:
期刊论文
[1]深度学习在智能机器人中的应用研究综述[J]. 龙慧,朱定局,田娟. 计算机科学. 2018(S2)
[2]机械臂抓取行为规划研究综述[J]. 韩丽丽,王奇志,杨永刚. 计算机与现代化. 2018(09)
[3]自动驾驶仿真系统中网络安全测试方法研究[J]. 罗璎珞,石娟. 摩托车技术. 2018(06)
[4]基于神经网络的机械臂的模仿学习研究[J]. 于建均,徐骢驰,阮晓钢,门玉森. 控制工程. 2017(11)
[5]非线性最优机器人手眼标定[J]. 王君臣,王田苗,杨艳,胡磊. 西安交通大学学报. 2011(09)
硕士论文
[1]连续空间下基于面部图像的情感分析方法研究[D]. 刘磊.西安理工大学 2019
[2]基于FPGA的复合卷积神经网络算法加速设计[D]. 肖扬.西安理工大学 2019
[3]基于人工神经网络的中外合作办学专业高考分数线预测研究[D]. 吴凯.江西财经大学 2019
[4]基于卷积神经网络的机器人抓取位姿自主检测算法研究[D]. 周彪.华中科技大学 2019
[5]基于深度图像和深度学习的机器人抓取检测算法研究[D]. 王斌.浙江大学 2019
[6]基于双流卷积神经网络的监控视频中打斗行为识别研究[D]. 高阳.西安理工大学 2018
[7]基于深度学习的物体检测和抓取技术研究[D]. 夏壮.哈尔滨工业大学 2018
[8]基于深度学习的机器人抓取仿真训练技术研究[D]. 柳俊先.哈尔滨工业大学 2018
[9]基于模型学习和线性二次型最优控制的机械臂控制器设计[D]. 于程隆.哈尔滨工业大学 2018
[10]基于深度学习的短视频内容分析算法研究[D]. 李夏南.哈尔滨工业大学 2018
本文编号:3063654
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3063654.html