基于深度学习的目标检测优化算法研究及嵌入式计算平台应用
发布时间:2022-04-23 09:50
近十年来,深度学习在理论和工程上都取得了显著的成果,如图像识别、目标检测、自然语言处理等。而在深度学习应用到目标检测之前,传统目标检测的特征提取部分需要人工设计特征,但在面临目标特征多样繁杂的场景时,人工设计特征的难度会变得很大。基于深度学习的目标检测则不需要人工设计特征,而是通过卷积神经网络学习特征。它从基于区域提名的R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN、R-FCN到端到端的YOLO、SSD,识别精度和识别速率都已经远远超过传统目标检测方法。如今已应用在无人驾驶、车辆检测和行人检测等领域。目前,大多数基于深度学习的目标检测模型由于体积太大,无法在嵌入式计算平台上直接实现前向推理,并且通常的工作模式是“嵌入式计算平台-云计算-嵌入式计算平台”,即先在嵌入式计算平台上采集需要检测的图像或视频;然后通过网络传送到云端服务器,利用基于深度学习的目标检测模型对图像或视频进行检测;最后检测结果被传输回嵌入式计算平台。这种工作模式不仅会导致整体对网络的依赖过大,而且会造成结果显示的延时。针对这一问题,本文对基于深度学习的目标检测优化算法进行研究。本文主要研究内...
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
图1.1?ImageNet图像分类竞赛成绩??
ResNet等,模型性能不断提高。下面主要介绍LeNet、AlexNet、??GoogLeNet?和?ResNet。??2.1.1?LeNet??LeNet模型是YanLeCun在1998年提出的,它主要用于识别手写数字。最??初的LeNet-5模型主要由卷积层、池化层和全连接层构成。??其中卷积层主要操作是将多个滤波器作用在输入图像上,提取图像中不同特??征,其中的滤波器被称为卷积核,而通过卷积操作后输出的图像称为特征图。以??二维卷积层为例:假设输入是高和宽都为3的二维数组,如图2.1中的输入所示;??其对应的卷积核是高和宽均为2的数组,如图2.1中的卷积核所示。??输入?卷积核?输出??圓册国??图2.1卷积操作??假设每做一次卷积,当卷积步长为1?(即卷积核移动一个像素)时,卷积核??会从输入数组的最左上方开始,按从左往右、从上往下的顺序,依次在输入数组??上滑动。卷积核每滑动一个位置,相对应的输入子数组与卷积核按元素会相乘并??相加,最后得到输出数组相对应的值。当卷积核移动到输入数组的左上方时,如??图2.1中的蓝色部分所示,输出数组的值为1X0+2X1+4X2+5X3=25,卷积操??作的整体输出如图2.1中的输出所示。??二维卷积层是在图2.1中的输出上加一个标量偏差(bias)。卷积层的模型参数??8??
图2.3最大池化与平均池化??
【参考文献】:
期刊论文
[1]基于YOLO2和ResNet算法的监控视频中的人脸检测与识别[J]. 朱超平,杨艺. 重庆理工大学学报(自然科学). 2018(08)
[2]基于Haar特性的改进HOG的人脸特征提取算法[J]. 蒋政,程春玲. 计算机科学. 2017(01)
[3]基于视觉的目标检测与跟踪综述[J]. 尹宏鹏,陈波,柴毅,刘兆栋. 自动化学报. 2016(10)
[4]LBP和HOG的分层特征融合的人脸识别[J]. 万源,李欢欢,吴克风,童恒庆. 计算机辅助设计与图形学学报. 2015(04)
[5]基于树莓派的网络监控系统的研究与实现[J]. 汪鑫,彭雨薇. 硅谷. 2014(14)
[6]AdaBoost算法研究进展与展望[J]. 曹莹,苗启广,刘家辰,高琳. 自动化学报. 2013(06)
[7]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正. 计算机应用研究. 2012(08)
[8]基于单类SVM的遥感图像目标检测[J]. 王凯峰,秦前清. 计算机工程与应用. 2005(32)
硕士论文
[1]基于轻量级计算平台的卷积神经网络研究[D]. 王磊.电子科技大学 2018
[2]智能车牌识别系统的实现与优化[D]. 姜晓.东华大学 2017
[3]基于FPGA的Adaboost人脸检测算法设计与验证[D]. 庞伟.东南大学 2017
[4]基于深度神经网络的肌电信号降维与分类方法[D]. 陈波.东华大学 2017
[5]基于Adaboost算法和肤色分割的人脸检测算法[D]. 刘丹利.西北师范大学 2014
[6]基于HOG和Haar-like融合特征的车辆检测[D]. 杨慧.南京邮电大学 2013
本文编号:3646945
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
图1.1?ImageNet图像分类竞赛成绩??
ResNet等,模型性能不断提高。下面主要介绍LeNet、AlexNet、??GoogLeNet?和?ResNet。??2.1.1?LeNet??LeNet模型是YanLeCun在1998年提出的,它主要用于识别手写数字。最??初的LeNet-5模型主要由卷积层、池化层和全连接层构成。??其中卷积层主要操作是将多个滤波器作用在输入图像上,提取图像中不同特??征,其中的滤波器被称为卷积核,而通过卷积操作后输出的图像称为特征图。以??二维卷积层为例:假设输入是高和宽都为3的二维数组,如图2.1中的输入所示;??其对应的卷积核是高和宽均为2的数组,如图2.1中的卷积核所示。??输入?卷积核?输出??圓册国??图2.1卷积操作??假设每做一次卷积,当卷积步长为1?(即卷积核移动一个像素)时,卷积核??会从输入数组的最左上方开始,按从左往右、从上往下的顺序,依次在输入数组??上滑动。卷积核每滑动一个位置,相对应的输入子数组与卷积核按元素会相乘并??相加,最后得到输出数组相对应的值。当卷积核移动到输入数组的左上方时,如??图2.1中的蓝色部分所示,输出数组的值为1X0+2X1+4X2+5X3=25,卷积操??作的整体输出如图2.1中的输出所示。??二维卷积层是在图2.1中的输出上加一个标量偏差(bias)。卷积层的模型参数??8??
图2.3最大池化与平均池化??
【参考文献】:
期刊论文
[1]基于YOLO2和ResNet算法的监控视频中的人脸检测与识别[J]. 朱超平,杨艺. 重庆理工大学学报(自然科学). 2018(08)
[2]基于Haar特性的改进HOG的人脸特征提取算法[J]. 蒋政,程春玲. 计算机科学. 2017(01)
[3]基于视觉的目标检测与跟踪综述[J]. 尹宏鹏,陈波,柴毅,刘兆栋. 自动化学报. 2016(10)
[4]LBP和HOG的分层特征融合的人脸识别[J]. 万源,李欢欢,吴克风,童恒庆. 计算机辅助设计与图形学学报. 2015(04)
[5]基于树莓派的网络监控系统的研究与实现[J]. 汪鑫,彭雨薇. 硅谷. 2014(14)
[6]AdaBoost算法研究进展与展望[J]. 曹莹,苗启广,刘家辰,高琳. 自动化学报. 2013(06)
[7]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正. 计算机应用研究. 2012(08)
[8]基于单类SVM的遥感图像目标检测[J]. 王凯峰,秦前清. 计算机工程与应用. 2005(32)
硕士论文
[1]基于轻量级计算平台的卷积神经网络研究[D]. 王磊.电子科技大学 2018
[2]智能车牌识别系统的实现与优化[D]. 姜晓.东华大学 2017
[3]基于FPGA的Adaboost人脸检测算法设计与验证[D]. 庞伟.东南大学 2017
[4]基于深度神经网络的肌电信号降维与分类方法[D]. 陈波.东华大学 2017
[5]基于Adaboost算法和肤色分割的人脸检测算法[D]. 刘丹利.西北师范大学 2014
[6]基于HOG和Haar-like融合特征的车辆检测[D]. 杨慧.南京邮电大学 2013
本文编号:3646945
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3646945.html
最近更新
教材专著