基于深度学习的目标实时检测模型的研究与实现
发布时间:2021-04-08 02:03
目标检测是当前计算机视觉领域的一个研究热点,主要任务是找出图像或视频中所有感兴趣目标的位置,并给出每个目标的具体类别。近年来,目标检测在很多计算机视觉领域中已经有了很多成熟的应用,如车辆自动驾驶、图像检索、视频监控和信息采集等。基于传统图像处理和机器学习的目标检测算法通常使用手工设计的特征,并且利用小样本进行训练,这种做法常常会受到光照、遮挡和环境变化等因素的影响,最终导致目标检测的效果不佳。与传统目标检测算法相比,基于深度学习的目标检测算法拥有突出的性能优势,然而深度学习也具有一定的缺点。高复杂度的深度学习模型虽然具有更好的性能,但是高额的存储空间和计算资源消耗导致其难以有效地应用在体积、功耗等方面受限的移动和嵌入式设备上。庞大的计算量导致神经网络模型不能在移动、嵌入式等设备上实时运行,针对这一问题,业界许多学者研究模型压缩和加速算法,剔除神经网络的冗余信息。因此本文提出将模型压缩技术应用于SSD(Single Shot Multi Box Detector)目标检测模型,减少目标检测模型的内存占用、加快推断速度及节省能耗。具体工作内容如下:1)主干网络模型搭建和压缩。本文将SSD的...
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
传统目标检测算法流程
东南大学硕士学位论文4针对YOLO算法对目标的定位精度不高这一问题,2016年12月北卡大学教堂山分校的Liu等人提出了SSD[20]目标检测算法,其主要从两个方面实现快速且高检测精度的目标检测效果:首先,SSD利用多尺度特征图进行检测,尺度较大的特征图可用于检测小目标,尺度较小的特征图可用于检测大目标;其次,SSD在每个尺度的特征图上使用了具有不同尺度和宽高比的默认框[21],可以包含具有不同大小和形状的目标。基于深度学习的目标检测算法归纳总结如图1-2所示:图1-2基于深度学习的目标检测算法归纳总结FasterR-CNN、YOLO、SSD和YOLOv2算法的性能对比如表1-1所示,FasterR-CNN(VGG16)表示基于VGG16的FasterR-CNN模型。表1-1中的mAP值是各个模型在PASCALVOC2007test上的测试结果。表1-1FasterR-CNN、YOLO、SSD和YOLOv2算法的性能对比ModelInputDimensionDatamAP(%)SpeedonTitanXGPU(FPS)FasterR-CNN(VGG16)1000×600PASCALVOC07+12trainval73.27YOLO448×448PASCALVOC07+12trainval63.445SSD300×300PASCALVOC07+12trainval74.346YOLOv2288×288PASCALVOC07+12trainval69.0911.3本文的研究内容本文主要是对基于深度学习的目标实时检测模型进行研究,目的是实现目标检测模型在保持准确率的同时,有效减小模型的参数量并且提高模型的检测速度。主要研究内容如图1-3所示:
第一章绪论5图1-3本文的研究内容1)主干网络模型搭建。相对于原始SSD算法使用的主干网络为VGG,本文使用参数量较少的DenseNet-47,其包含一个StemBlock、四个DenseBlock、三个TransitionLayer以及一个分类层。2)基于第一点工作对主干网络模型进行压缩。本文使用结构化剪枝方法,根据网络原有的批量归一化(BatchNormalization,BN)层的γ参数对特征图每个通道的重要性进行评估,然后将重要性低于某个阈值的特征图通道剪掉,与此同时生成这些特征图通道的对应卷积核也被剪掉。3)将压缩后的主干网络和SSD高效结合,构建CP-SSD模型。原始SSD算法选择了6个尺度(38×38,19×19,10×10,5×5,3×3,1×1)的特征图进行预测,为了减小计算量,本文舍去38×38尺度的特征图,增加2×2尺度的特征图进行预测,并在19×19尺度的特征图上减少默认框的数量。原始SSD用3×3的卷积生成附加的特征图以及预测类别和边框位置,本文改用深度可分解卷积生成附加的特征图,使用1×1的卷积核来预测类别分数和边框位置,并且在预测之前构建一个残差块(Resblock),此残差块可大幅提升算法的平均精度均值。4)CP-SSD算法性能分析。本文将压缩后的目标检测模型称为紧凑SSD(CompactSSD),简写为CP-SSD,使用平均精度均值(mAP)、模型大小以及检测速度(FPS)指标对压缩后的检测模型进行性能分析,证明本文模型压缩方法应用在目标检测算法上的有效性。1.4论文组织结构按照上节所述的研究内容,本文共分为6章,各章的主要内容具体如下:第一章为绪论,主要阐述了论文的研究背景及意义,总结了传统目标检测方法和基于深度学习的目标检测算法,最后给出了研究的主要内容以及本文的组织结构。第二章介绍了相关理论和工作基础,首先介绍了神经网络的基本组成单
【参考文献】:
期刊论文
[1]神经网络模型压缩方法综述[J]. 曹文龙,芮建武,李敏. 计算机应用研究. 2019(03)
[2]基于人工神经网络的车牌识别[J]. 吴聪,殷浩,黄中勇,刘罡. 计算机技术与发展. 2016(12)
[3]深度学习研究进展[J]. 郭丽丽,丁世飞. 计算机科学. 2015(05)
博士论文
[1]智能监控系统中行人重识别方法研究[D]. 刘晓凯.大连理工大学 2017
硕士论文
[1]基于目标检测的快消品识别研究与应用[D]. 王振.湖南大学 2018
[2]基于深度学习的敏感人脸图像在视频流中的检测与识别[D]. 袁丽萍.兰州大学 2018
[3]基于深度学习的人脸检测和识别方法研究[D]. 刘婧月.电子科技大学 2018
[4]基于深度学习的目标检测算法研究[D]. 张志豪.电子科技大学 2018
[5]基于深度学习和空间邻域信息的极化SAR地物分类方法研究[D]. 樊伟明.西安电子科技大学 2017
[6]基于深度学习的图像检索研究[D]. 马冬梅.内蒙古大学 2014
[7]基于卷积神经网络的深度学习算法与应用研究[D]. 陈先昌.浙江工商大学 2014
[8]采用神经网络和压电阻抗技术的焊接结构健康监测研究[D]. 朱楚为.南京航空航天大学 2012
本文编号:3124630
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
传统目标检测算法流程
东南大学硕士学位论文4针对YOLO算法对目标的定位精度不高这一问题,2016年12月北卡大学教堂山分校的Liu等人提出了SSD[20]目标检测算法,其主要从两个方面实现快速且高检测精度的目标检测效果:首先,SSD利用多尺度特征图进行检测,尺度较大的特征图可用于检测小目标,尺度较小的特征图可用于检测大目标;其次,SSD在每个尺度的特征图上使用了具有不同尺度和宽高比的默认框[21],可以包含具有不同大小和形状的目标。基于深度学习的目标检测算法归纳总结如图1-2所示:图1-2基于深度学习的目标检测算法归纳总结FasterR-CNN、YOLO、SSD和YOLOv2算法的性能对比如表1-1所示,FasterR-CNN(VGG16)表示基于VGG16的FasterR-CNN模型。表1-1中的mAP值是各个模型在PASCALVOC2007test上的测试结果。表1-1FasterR-CNN、YOLO、SSD和YOLOv2算法的性能对比ModelInputDimensionDatamAP(%)SpeedonTitanXGPU(FPS)FasterR-CNN(VGG16)1000×600PASCALVOC07+12trainval73.27YOLO448×448PASCALVOC07+12trainval63.445SSD300×300PASCALVOC07+12trainval74.346YOLOv2288×288PASCALVOC07+12trainval69.0911.3本文的研究内容本文主要是对基于深度学习的目标实时检测模型进行研究,目的是实现目标检测模型在保持准确率的同时,有效减小模型的参数量并且提高模型的检测速度。主要研究内容如图1-3所示:
第一章绪论5图1-3本文的研究内容1)主干网络模型搭建。相对于原始SSD算法使用的主干网络为VGG,本文使用参数量较少的DenseNet-47,其包含一个StemBlock、四个DenseBlock、三个TransitionLayer以及一个分类层。2)基于第一点工作对主干网络模型进行压缩。本文使用结构化剪枝方法,根据网络原有的批量归一化(BatchNormalization,BN)层的γ参数对特征图每个通道的重要性进行评估,然后将重要性低于某个阈值的特征图通道剪掉,与此同时生成这些特征图通道的对应卷积核也被剪掉。3)将压缩后的主干网络和SSD高效结合,构建CP-SSD模型。原始SSD算法选择了6个尺度(38×38,19×19,10×10,5×5,3×3,1×1)的特征图进行预测,为了减小计算量,本文舍去38×38尺度的特征图,增加2×2尺度的特征图进行预测,并在19×19尺度的特征图上减少默认框的数量。原始SSD用3×3的卷积生成附加的特征图以及预测类别和边框位置,本文改用深度可分解卷积生成附加的特征图,使用1×1的卷积核来预测类别分数和边框位置,并且在预测之前构建一个残差块(Resblock),此残差块可大幅提升算法的平均精度均值。4)CP-SSD算法性能分析。本文将压缩后的目标检测模型称为紧凑SSD(CompactSSD),简写为CP-SSD,使用平均精度均值(mAP)、模型大小以及检测速度(FPS)指标对压缩后的检测模型进行性能分析,证明本文模型压缩方法应用在目标检测算法上的有效性。1.4论文组织结构按照上节所述的研究内容,本文共分为6章,各章的主要内容具体如下:第一章为绪论,主要阐述了论文的研究背景及意义,总结了传统目标检测方法和基于深度学习的目标检测算法,最后给出了研究的主要内容以及本文的组织结构。第二章介绍了相关理论和工作基础,首先介绍了神经网络的基本组成单
【参考文献】:
期刊论文
[1]神经网络模型压缩方法综述[J]. 曹文龙,芮建武,李敏. 计算机应用研究. 2019(03)
[2]基于人工神经网络的车牌识别[J]. 吴聪,殷浩,黄中勇,刘罡. 计算机技术与发展. 2016(12)
[3]深度学习研究进展[J]. 郭丽丽,丁世飞. 计算机科学. 2015(05)
博士论文
[1]智能监控系统中行人重识别方法研究[D]. 刘晓凯.大连理工大学 2017
硕士论文
[1]基于目标检测的快消品识别研究与应用[D]. 王振.湖南大学 2018
[2]基于深度学习的敏感人脸图像在视频流中的检测与识别[D]. 袁丽萍.兰州大学 2018
[3]基于深度学习的人脸检测和识别方法研究[D]. 刘婧月.电子科技大学 2018
[4]基于深度学习的目标检测算法研究[D]. 张志豪.电子科技大学 2018
[5]基于深度学习和空间邻域信息的极化SAR地物分类方法研究[D]. 樊伟明.西安电子科技大学 2017
[6]基于深度学习的图像检索研究[D]. 马冬梅.内蒙古大学 2014
[7]基于卷积神经网络的深度学习算法与应用研究[D]. 陈先昌.浙江工商大学 2014
[8]采用神经网络和压电阻抗技术的焊接结构健康监测研究[D]. 朱楚为.南京航空航天大学 2012
本文编号:3124630
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3124630.html
最近更新
教材专著