基于改进的端到端卷积神经网络的目标检测算法研究
发布时间:2021-11-05 05:12
基于深度卷积神经网络的目标检测算法的定义是利用深度卷积神经网络构建模型,之后利用模型对给定的图片或视频中感兴趣的目标进行定位和识别。根据算法的结构中是否包含区域建议模块,基于深度卷积神经网络的目标检测算法的模型可以划分为单阶段检测算法和二阶段检测算法,两者在自动驾驶、行人重识别、人脸识别等领域得到了普遍的应用。其中单阶段检测算法在检测速度上相较于二阶段检测算法占有优势,但是在检测准确率上相对劣势,通过改进算法的网络结构的方法可以弥补单阶段算法的不足。在实际应用中,基于深度卷积神经网络的目标检测算法的模型存在参数量过大、占用大量存储空间的不足,通过对算法模型进行轻量化改进,使得算法在满足准确率和检测速度需求的同时减少参数量,从而降低模型的存储大小。因此,针对基于深度卷积神经网络的目标检测算法的研究,在学术上和实际应用上都有着重要的价值。本文主要针对的是单阶段检测算法中的YOLO v3和FSSD进行结构的改进以提升算法的检测速度和准确率,主要研究工作如下:1、提出了一种基于改进的YOLO v3的目标检测算法。该方法主要是利用深度可分离卷积构建的MobileNet网络对YOLO v3算法中的...
【文章来源】:湖北工业大学湖北省
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
本文组织结构图
湖北工业大学学术硕士学位论文9表2.1OverFeat快速版结构表网络层1234567输出阶段conv+maxconv+maxconvconvconv+max全连接全连接全连接通道数9625651210241024307240961000卷积核大小11×115×53×33×33×3---卷积步长4×41×11×11×11×1---池化核大小2×22×2--2×2---池化步长2×22×2--2×2---填充大小--1×1×1×11×1×1×11×1×1×1---输入大小231×23124×2412×1212×1212×126×61×11×12015年,Joseph和Girshick等人提出了名为YOLO[11]的基于深度卷积神经网络的目标检测算法,该算法的网络模型是早期的统一结构的典型的单阶段目标检测算法。算法的网络结构为一个单一的卷积神经网络,定位和分类的分支共享同一个网络模型产生的特征图。YOLO的模型的网络结构如图2.3所示[11]。图2.3YOLO网络结构YOLO算法的核心优势在于检测速度快,通常版本的YOLO算法检测速度可以达到每秒45张图片。而极速版本的YOLO算法,其检测速度甚至可以达到每秒155张图,这是因为YOLO算法的设计初衷是为了满足实时检测的需求。YOLO算法虽然在速度上与同时期最好的模型相比具有很大的优势,但是在准确率上相交与同时期的基于深度学习的目标检测算法,例如FasterRCNN等,相对较弱。
湖北工业大学学术硕士学位论文13具体的改进内容为:1、将深度可分离卷积模块的输出部分的ReLU6激活函数替换成线性的激活函数,减少ReLU函数对低维度张量计算所导致的信息丢失;2、在深度可分离卷积模块之前引入一个1×1的逐点卷积操作来提升输入张量的通道数,即对输入的张量进行维度提升;3、在模块中引入跳跃连接,将模块的输入传到模块的末尾部分与经过模块处理的结果通过相加的方式进行合并(当步长为2时,模块不需要这一步骤)。线性瓶颈的反向残差模块[39]的结构如图2.5所示。图2.5线性瓶颈的反向残差模块结构示意图2.2.2ShufflenetShuffleNet[26]是由旷世公司提出的高效计算的轻量化网络模型,主要应用于计算能力和存储能力有限的移动设备上。表2.5为ShuffleNet网络结构[26]的表格。ShuffleNet的网络结构中有两个核心的创新之处,其一是逐点分组卷积,另一个是通道随机洗牌[26]。逐点分组卷积的操作主要是将特征图沿着通道维度进行划分,划分后的每组特征图由对应的卷积核进行处理和计算,这样可以实现多个卷积的并行计算,提升卷积计算的效率。通道随机洗牌的操作主要是将各个分组计算得到的特征图进行随机的混合,再传入到下一个分组卷积的网络层中。在
【参考文献】:
期刊论文
[1]结合反残差块和YOLOv3的目标检测法[J]. 焦天驰,李强,林茂松,贺贤珍. 传感器与微系统. 2019(09)
[2]基于深度融合的显著性目标检测算法[J]. 张冬明,靳国庆,代锋,袁庆升,包秀国,张勇东. 计算机学报. 2019(09)
[3]改进的SSD航拍目标检测方法[J]. 裴伟,许晏铭,朱永英,王鹏乾,鲁明羽,李飞. 软件学报. 2019(03)
[4]面向小目标的多尺度Faster-RCNN检测算法[J]. 黄继鹏,史颖欢,高阳. 计算机研究与发展. 2019(02)
[5]基于改进特征金字塔的Mask R-CNN目标检测方法[J]. 任之俊,蔺素珍,李大威,王丽芳,左健宏. 激光与光电子学进展. 2019(04)
[6]深度卷积神经网络的发展及其在计算机视觉领域的应用[J]. 张顺,龚怡宏,王进军. 计算机学报. 2019(03)
本文编号:3477143
【文章来源】:湖北工业大学湖北省
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
本文组织结构图
湖北工业大学学术硕士学位论文9表2.1OverFeat快速版结构表网络层1234567输出阶段conv+maxconv+maxconvconvconv+max全连接全连接全连接通道数9625651210241024307240961000卷积核大小11×115×53×33×33×3---卷积步长4×41×11×11×11×1---池化核大小2×22×2--2×2---池化步长2×22×2--2×2---填充大小--1×1×1×11×1×1×11×1×1×1---输入大小231×23124×2412×1212×1212×126×61×11×12015年,Joseph和Girshick等人提出了名为YOLO[11]的基于深度卷积神经网络的目标检测算法,该算法的网络模型是早期的统一结构的典型的单阶段目标检测算法。算法的网络结构为一个单一的卷积神经网络,定位和分类的分支共享同一个网络模型产生的特征图。YOLO的模型的网络结构如图2.3所示[11]。图2.3YOLO网络结构YOLO算法的核心优势在于检测速度快,通常版本的YOLO算法检测速度可以达到每秒45张图片。而极速版本的YOLO算法,其检测速度甚至可以达到每秒155张图,这是因为YOLO算法的设计初衷是为了满足实时检测的需求。YOLO算法虽然在速度上与同时期最好的模型相比具有很大的优势,但是在准确率上相交与同时期的基于深度学习的目标检测算法,例如FasterRCNN等,相对较弱。
湖北工业大学学术硕士学位论文13具体的改进内容为:1、将深度可分离卷积模块的输出部分的ReLU6激活函数替换成线性的激活函数,减少ReLU函数对低维度张量计算所导致的信息丢失;2、在深度可分离卷积模块之前引入一个1×1的逐点卷积操作来提升输入张量的通道数,即对输入的张量进行维度提升;3、在模块中引入跳跃连接,将模块的输入传到模块的末尾部分与经过模块处理的结果通过相加的方式进行合并(当步长为2时,模块不需要这一步骤)。线性瓶颈的反向残差模块[39]的结构如图2.5所示。图2.5线性瓶颈的反向残差模块结构示意图2.2.2ShufflenetShuffleNet[26]是由旷世公司提出的高效计算的轻量化网络模型,主要应用于计算能力和存储能力有限的移动设备上。表2.5为ShuffleNet网络结构[26]的表格。ShuffleNet的网络结构中有两个核心的创新之处,其一是逐点分组卷积,另一个是通道随机洗牌[26]。逐点分组卷积的操作主要是将特征图沿着通道维度进行划分,划分后的每组特征图由对应的卷积核进行处理和计算,这样可以实现多个卷积的并行计算,提升卷积计算的效率。通道随机洗牌的操作主要是将各个分组计算得到的特征图进行随机的混合,再传入到下一个分组卷积的网络层中。在
【参考文献】:
期刊论文
[1]结合反残差块和YOLOv3的目标检测法[J]. 焦天驰,李强,林茂松,贺贤珍. 传感器与微系统. 2019(09)
[2]基于深度融合的显著性目标检测算法[J]. 张冬明,靳国庆,代锋,袁庆升,包秀国,张勇东. 计算机学报. 2019(09)
[3]改进的SSD航拍目标检测方法[J]. 裴伟,许晏铭,朱永英,王鹏乾,鲁明羽,李飞. 软件学报. 2019(03)
[4]面向小目标的多尺度Faster-RCNN检测算法[J]. 黄继鹏,史颖欢,高阳. 计算机研究与发展. 2019(02)
[5]基于改进特征金字塔的Mask R-CNN目标检测方法[J]. 任之俊,蔺素珍,李大威,王丽芳,左健宏. 激光与光电子学进展. 2019(04)
[6]深度卷积神经网络的发展及其在计算机视觉领域的应用[J]. 张顺,龚怡宏,王进军. 计算机学报. 2019(03)
本文编号:3477143
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3477143.html