基于Faster R-CNN的目标检测模型研究与实现
发布时间:2021-09-25 08:02
目标检测是计算机视觉领域的一个基本任务,已经应用于诸多现实应用之中,如人脸识别、自动驾驶、监控安防等领域。目标检测通俗来说就是找到图片中感兴趣的区域,这些区域有不同的大小、不同的类别、不同的形状,具有复杂性和多样性,这无疑给目标检测带来巨大的困难。随着深度学习的崛起,目标检测有了新的方向。时至今日,深度学习时代的目标检测算法虽已全面超越传统算法,但仍然有很多问题没有解决。本文梳理了深度学习时代目标检测技术的演变和发展,深度剖析了Faster R-CNN、R-FCN、FPN等具有代表性的目标检测模型的优缺点,主要在两个问题上做了重点研究,小目标检测和如何获取图像的上下文关系以指导检测。小目标检测一直是目标检测的难点,具有特征少、数量多的特点。通常解决小目标需要多尺度目标检测技术,但现有框架在使用多尺度检测技术上往往牺牲了图像的高级语义,而图像的高级语义对目标检测来说是及其重要的。本文在不牺牲图像语义的基础上于Faster R-CNN框架上构建了一套多尺度检测方案,以不同规模的卷积处理不同规模的候选提案,并在梯度下降时加以筛选。实验证明本文所述多尺度检测方案可以显著提升目标检测准确率,在c...
【文章来源】:天津工业大学天津市
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
FasterR-CNN结构图
第二章目标检测算法分析9图送给RPN网络,自此进入RPN阶段,特征图也可以看做特征向量。随后特征图经过一个3*3的卷积,得到一个13*13*256的特征图,然后经过两次1*1的卷积,分别得到13*13*(2*9)、13*13*(4*9)的特征图,前者用来表示候选框背景和前景的得分,后者主要用来边框回归,至此再结合之前预定义的锚点(Anchors),经过非极大值抑制(NMS)方法得到候选框[44]。RPN执行粗略的分类操作和边框回归操作,将初期筛选的结果送给RoiPooling层,然后由RoiPooling层执行更精确的分类操作和边框回归操作,图2-2就是RPN工作的示意图。图2-2RPN工作示意图图2-3RPN计算方法具体将图片经过卷积神经网络得到高级抽象表示的特征图后,经过图上的滑
第二章目标检测算法分析9图送给RPN网络,自此进入RPN阶段,特征图也可以看做特征向量。随后特征图经过一个3*3的卷积,得到一个13*13*256的特征图,然后经过两次1*1的卷积,分别得到13*13*(2*9)、13*13*(4*9)的特征图,前者用来表示候选框背景和前景的得分,后者主要用来边框回归,至此再结合之前预定义的锚点(Anchors),经过非极大值抑制(NMS)方法得到候选框[44]。RPN执行粗略的分类操作和边框回归操作,将初期筛选的结果送给RoiPooling层,然后由RoiPooling层执行更精确的分类操作和边框回归操作,图2-2就是RPN工作的示意图。图2-2RPN工作示意图图2-3RPN计算方法具体将图片经过卷积神经网络得到高级抽象表示的特征图后,经过图上的滑
本文编号:3409392
【文章来源】:天津工业大学天津市
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
FasterR-CNN结构图
第二章目标检测算法分析9图送给RPN网络,自此进入RPN阶段,特征图也可以看做特征向量。随后特征图经过一个3*3的卷积,得到一个13*13*256的特征图,然后经过两次1*1的卷积,分别得到13*13*(2*9)、13*13*(4*9)的特征图,前者用来表示候选框背景和前景的得分,后者主要用来边框回归,至此再结合之前预定义的锚点(Anchors),经过非极大值抑制(NMS)方法得到候选框[44]。RPN执行粗略的分类操作和边框回归操作,将初期筛选的结果送给RoiPooling层,然后由RoiPooling层执行更精确的分类操作和边框回归操作,图2-2就是RPN工作的示意图。图2-2RPN工作示意图图2-3RPN计算方法具体将图片经过卷积神经网络得到高级抽象表示的特征图后,经过图上的滑
第二章目标检测算法分析9图送给RPN网络,自此进入RPN阶段,特征图也可以看做特征向量。随后特征图经过一个3*3的卷积,得到一个13*13*256的特征图,然后经过两次1*1的卷积,分别得到13*13*(2*9)、13*13*(4*9)的特征图,前者用来表示候选框背景和前景的得分,后者主要用来边框回归,至此再结合之前预定义的锚点(Anchors),经过非极大值抑制(NMS)方法得到候选框[44]。RPN执行粗略的分类操作和边框回归操作,将初期筛选的结果送给RoiPooling层,然后由RoiPooling层执行更精确的分类操作和边框回归操作,图2-2就是RPN工作的示意图。图2-2RPN工作示意图图2-3RPN计算方法具体将图片经过卷积神经网络得到高级抽象表示的特征图后,经过图上的滑
本文编号:3409392
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3409392.html
最近更新
教材专著