基于深度学习的单发多框检测器优化算法研究

发布时间:2022-01-15 05:00
  目标检测作为计算机视觉的基础任务之一,为解决分割、场景理解和目标跟踪等更复杂或更高层次的计算机视觉任务奠定了基础,它在包括机器人视觉、人机交互和自动驾驶等人工智能和信息技术领域有着广泛的应用。随着深度学习技术的发展,基于深度学习的目标检测算法取得了较大的进展,单发多框检测器(Single Shot multibox Detector,SSD)是一种在简单性、快速性和准确性之间提供最佳权衡的目标检测算法。本文选择SSD算法作为基础开展研究,考虑该算法存在小目标检测不够鲁棒以及训练过程中样本和多任务不平衡等问题,对如何提高SSD算法的检测性能进行了深入研究并提出了三种有效的解决方案。本文主要工作内容如下:首先,在详细介绍了SSD算法的网络结构和原理的基础上,针对其网络结构中检测层单一的利用方式导致特征信息使用不充分的缺点,提出了一种基于双向特征融合改进的单发多框检测器算法(Two-way Feature fusion based Single Shot multibox Detector,TFSSD)。TFSSD算法利用提出的双向特征融合模块(Two-way Feature Fusion ... 

【文章来源】:重庆邮电大学重庆市

【文章页数】:81 页

【学位级别】:硕士

【部分图文】:

基于深度学习的单发多框检测器优化算法研究


目标检测示意图

直方图,目标检测,进程,算法


重庆邮电大学硕士学位论文第1章绪论3(1).利用多个尺度的滑动窗口来确定输入图像中可能包含目标物体的候选区域;(2).从这些可能的候选区域中提取相关的视觉特征;(3).利用分类器对这些提取的视觉特征进行分类和识别。早期对目标检测的研究是基于模板匹配技术和简单手工特征的模型,重点研究空间布局大致刚性的特定物体,如眼睛、嘴巴和人脸等。传统的目标检测算法一般是基于手工设计的几何特征作为输入。常见的人工设计的特征算子有:SIFT(ScaleInvariantFeatureTransform,尺度不变特征变换)[4]、HOG(HistogramofOrientedGradient,方向梯度直方图)[5]和SURF(SpeededUpRobustFeatures,加速鲁棒特征)[6]等。随后,利用常见的统计分类器,如神经网络、支持向量机(SupportVectorMachine,SVM)[7]和Adaboost[8]等将目标进行分类。到20世纪90年代末和21世纪初,目标检测的研究取得了显著进展。基于候选区域和多类外观特征的框架不断被提出,这使得这些由手工绘制的局部描述特征和判别分类器组成的多级检测框架一直主导着计算机视觉的各个领域,包括目标检测。如图1.2所示,直到2012年的重要转折点,随着DCNN在图像分类方面取得了破纪录的结果[1],目标检测领域也开始进入基于DCNN的时代。但是传统领域提出的滑动窗口技术和多尺度金字塔策略等仍然广泛应用于基于DCNN的方法中。图1.2目标检测算法进程图1.2.2基于深度学习的目标检测算法研究现状自从深度学习进入目标检测领域以来,基于深度卷积神经网络的各种目标检测方法都取得了显著的进展并快速成为主流,目前主要的目标检测算法大致可以分为两类:

流程图,目标检测,进程,算法


重庆邮电大学硕士学位论文第1章绪论4(1).基于候选区域提议的目标检测算法,即两阶段检测框架算法。该方案首先采用目标区域生成算法产生一系列可能包含目标物体的候选区域,然后通过DCNN提取目标候选区域的视觉特征,并利用分类器对这些视觉特征进行分类,最后对目标进行真实边界框回归;(2).基于回归的目标检测算法,即一阶段检测框架算法。该方案无需生成目标候选区域,而是通过直接对预设定的锚框进行回归运算以得到物体类别的概率和位置坐标信息。1.基于候选区域提议的目标检测算法(两阶段检测框架算法)在基于候选区域提议的框架中,首先利用深度卷积神经网络从区域中提取图像的卷积特征,然后根据这些特征结合区域提议策略对目标进行分类和边界框回归。如图1.3所示,DetectorNet[9]、OverFeat[10]、MultiBox[11]和RCNN[12]独立且几乎同时提出了利用卷积神经网络来进行目标检测。图1.3基于深度学习的目标检测算法进程图图1.4RCNN算法流程图[12]2013年,R.Girshick等人[12]通过整合AlexNet和区域搜索算法(SelectiveSearch)[13]提出了具有开创性意义的两阶段检测算法RCNN(Region-basedConvolutionNeuralNetworks)算法,它取得了当时的最佳水平。如图1.4所示,RCNN框架由多阶段组成,首先选用区域搜索算法提取可能包含物体的目标候选区域,然后每个目标候选区域被变换到固定大小并通过AlxeNet来提取每个目标候选区域的深度特征,随后通过训练SVM分类器对这些特征进行分类,并预测出目标候选区域中所


本文编号:3589950

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3589950.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ebb35***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com