当前位置:主页 > 科技论文 > 自动化论文 >

基于深度神经网络的实时多物体检测

发布时间:2021-10-22 03:29
  目标检测是计算机视觉领域的经典问题,它集成了图像处理、模式识别、人工智能等领域的知识。相比图像识别和图像分类,需要解决目标定位和目标分类的任务。近年来,深度学习的快速发展极大的刺激了目标检测算法领域的研究。但是目标检测的实时性一直以来都是一大难题。YOLO系列算法在目标检测实时性方面做的很不错,YOLO的一个精简快速版的检测速度最高可以达到150FPS。但是速度的提升却带来了检测精度的严重下降。另一方面,R-CNN目标检测系列的最高之作Faster R-CNN在检测的准确性方面表现优异,在PASCAL VOC数据集上20类目标的平均检测精度达到了73.2m AP,但是在实时性方面却一直达不到令人满意的效果。针对以上问题,本文主要进行了以下内容的研究:模型的最终性能与效果不仅仅取决于模型的结构与训练的方法技巧,很大程度上依赖于数据集的质量。在目标检测领域,存在许多高质量的公开数据集,如PASCAL VOC数据集。不过大多数公开数据集都只包含静态的图片,不包括视频数据集。本文针对实时多物体检测的最终目标,针对性的自制了部分数据集,主要是各种场景下的视频数据集。本文识别的目标物体为常见的五类... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:66 页

【学位级别】:硕士

【部分图文】:

基于深度神经网络的实时多物体检测


目标分类与目标定位它是计算机视觉领域和多媒体领域的一个基础性课题,也是机器学习目前最火

神经元模型


哈尔滨工业大学工学硕士学位论文第 2 章 神经网络与深度学习络的演变过程网络(Artificial Neural Network,ANN)的灵感来自于生物一种近似模拟,多个神经元之间的相互连接可以组成系统结构。神经元解剖学家 McCulloch 和数学家 Pitts 在出了神经元的结构并给出了它的数学描述[27]。他们还的情况下,将它们按照一定的方式连接,就能够近似Culloch 和 Pitts 二人完成的工作被一致认为是 ANN 的起

多层感知机


图 2-2 多层感知机(MLP)不过很快地,人们在 1991 年发现 BP 算法存在梯度消失问题,随着神经网络层数的加深,在损失函数的梯度反向传播的过程中,后层的梯度层层叠乘于前层当中,使得越靠近前面的层数梯度越小,最后导致前面网络层的参数无法获得更新。由于 Sigmoid 函数的饱和特性,后层梯度本来就小,更加剧了梯度消失现象,该发现再次将神经网络拉至冰点。2006 年,Hinton 再次提出了新的神经网络研究观点,并给出了深层网络训练中反向传播导致梯度消失问题的解决方案:通过“逐层预训练”的方法来解决多隐含层神经网络在训练上的复杂度。并且在 2010 年 Vinod Nair 和 Geoffrey Hinton提出了使用新的激活函数——线性修正单元(Rectified Linear Units,ReLU)[32]来代替Sigmoid 激活函数。


本文编号:3450293

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3450293.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b9953***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com