基于SSD-Mobilenet网络和RGB-D相机的工件检测与定位系统研究

发布时间:2022-01-25 00:43
  近些年来,深度学习以及工业自动化技术的飞速发展使机器视觉在现代工业生产中被广泛应用。机器视觉可以获取场景内物体的各种信息,增强机器人对于周围环境的感知能力和对突变情况的反应能力,大大提高生产的效率。针对工业生产线上的工件实时检测与定位问题,本文提出了基于深度学习技术和双目IR结构光深度相机相结合的工件检测和定位方法,可以实现对目标工件的实时类别检测和三维坐标获取。论文将围绕目标检测算法、RGB-D深度相机以及三维视觉测量进行研究。随着深度学习的迅速发展和逐渐成熟,使用深度学习算法来解决目标检测问题是当下的主流。基于神经网络的各种目标检测算法接连问世,并且经过不断完善和改进在标准数据集上显示出了更好的性能。本文搭建了Google的Tensor Flow Object_detection API架构,采用SSD与Mobilenet网络相结合的SSD-Mobilenet网络实现对相机捕获的视频流中工件的实时检测。SSD网络将YOLO的回归理念和Faster RCNN的Anchor机制相结合,既保证了检测的速度,也达到了很高的准确度。Mobilenet模型是一种专门为嵌入式移动设备设计的轻量级... 

【文章来源】:河南大学河南省

【文章页数】:71 页

【学位级别】:硕士

【部分图文】:

基于SSD-Mobilenet网络和RGB-D相机的工件检测与定位系统研究


Sigmoid函数图

函数图,函数


基于SSD-Mobilenet网络和RGB-D相机的工件检测与定位系统研究16Sigmoid函数数学公式如下:f(x)=11+ex(2-8)图2-6Sigmoid函数图如图2-7是Tanh函数图,它解决了Sigmoid函数的输出不是以零为中心的问题,然而梯度弥散和幂运算的问题依旧存在。当输入非常大以及非常小时,输出也是几乎平滑,梯度很校Tanh函数的数学公式如下:tnh(x)=exexex+ex(2-9)图2-7Tanh函数图如图2-8所示是ReLU函数图,它是一个取最大值函数,具有单侧抑制的作用。在输入小于零时,输出为零;在输入信号比零大时,输出与输入相等。因此该函数线性不饱和,收敛速度更快,很好地解决了Sigmod函数梯度消失的问题,而且仅仅只要一个阈值就能获得激活值,减少了大量复杂的计算,但是也存在训练过程中因下降太快神经元不被激活的情况。

函数图


第2章工件检测与定位系统设计与理论基础17ReLU函数数学公式如下:fx=mx0x(2-10)图2-8Relu函数图如图2-9所示是LeakyReLU函数图,LeakyReLU解决了ReLU中出现的问题。横向正轴是斜率为一的线性函数,负轴是一个斜率较小的函数,这样在调整了数据分布的同时又能保证负轴信息的完整性。LeakyReLU函数数学公式如下:fx={xix≤0xix>0(2-11)——比1小很多的负数梯度值图2-9LeakyReLU函数图(2)池化层在卷积层进行卷积运算提取特征后,输出的特征图会输入到池化层进行筛选或融合,选取适当的有代表性的点来表示一个区域。这能进行泛化和降维,有效地减少计算量,在一定程度上防止过拟合。常用的有最大池化(Maxpooling)、平均池化(Average

【参考文献】:
期刊论文
[1]3D真的来了吗?——三维结构光传感器漫谈[J]. 左超,张晓磊,胡岩,尹维,沈德同,钟锦鑫,郑晶,陈钱.  红外与激光工程. 2020(03)
[2]基于结构光的三维测量技术研究[J]. 宋少哲,牛金星,张涛.  河南科技. 2019(22)
[3]基于Intel RealSense的胶印机感知展示系统设计[J]. 董春侠,司占军,刘建东.  包装工程. 2017(11)
[4]基于Kinect v2的实时精确三维重建系统[J]. 李诗锐,李琪,李海洋,侯沛宏,曹伟国,王向东,李华.  软件学报. 2016(10)
[5]迁移学习研究进展[J]. 庄福振,罗平,何清,史忠植.  软件学报. 2015(01)
[6]结构光编码方法综述[J]. 陈彦军,左旺孟,王宽全,吴秋峰.  小型微型计算机系统. 2010(09)
[7]结构光三维视觉测量关键技术的研究[J]. 吕乃光,孙鹏,娄小平,韩建栋.  北京信息科技大学学报(自然科学版). 2010(01)
[8]基于调制度分析的快速三维物体识别方法[J]. 王莹,苏显渝.  光学学报. 2010(03)
[9]一种自适应的Harris角点检测算法[J]. 赵万金,龚声蓉,刘纯平,沈项军.  计算机工程. 2008(10)
[10]基于双目计算机视觉的自适应识别算法及其监控应用[J]. 丁谨,王新.  中国图象图形学报. 2006(11)

博士论文
[1]基于神经网络的文本特征表示关键技术研究[D]. 韩旭.北京邮电大学 2019
[2]结构光深度图像获取和处理与三维重建研究[D]. 范剑英.哈尔滨理工大学 2010

硕士论文
[1]基于结构光视觉的非合作目标位姿估计与三维重构研究[D]. 祝宁宇.哈尔滨工业大学 2019
[2]基于结构光和立体视觉的主被动结合深度获取方法[D]. 窦平方.西安电子科技大学 2017
[3]双目结构光视觉系统及三维重建方法实现[D]. 王良丹.浙江工业大学 2017
[4]基于双目立体视觉的三维重建技术研究及实现[D]. 谭健胜.华南理工大学 2017
[5]双目结构光三维成像系统研究[D]. 冯云.湖南大学 2017
[6]基于计算机视觉中双目立体匹配技术研究[D]. 裴聪.江苏大学 2010
[7]快速中距离三维扫描仪设计和实现的研究[D]. 陈玉林.首都师范大学 2008
[8]基于傅里叶变换的点衍射干涉术的研究[D]. 王惠临.四川大学 2007



本文编号:3607593

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3607593.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b1169***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com