基于注意力机制的弱监督目标检测方法的研究
发布时间:2023-04-01 11:03
目标检测任务是计算机视觉领域的基本问题之一,而基于监督学习的目标检测算法是当前目标检测算法研究领域的主流,这导致了在大多数的情况下,一个高精度的标注数据集仍然目标检测模型能够获得良好性能的必要前提。然而,在很多实际的生产生活的场景中,高昂的图像获取成本和专家标注的难度导致了高质量图像标注的获取非常费时费力。随着深度学习技术与理论的不断发展,如何通过低质量的训练数据训练高质量的目标检测模型具有很高的研究意义和实用价值。针对这一问题本文提出了一种基于注意力机制的弱监督目标检测算法。使用注意力机制对信息进行筛选的能力来强化卷积神经网络本身的目标定位的属性,并以此为基础实现了在弱监督数据集下训练出可以进行粗略目标检测的模型。本文还针对注意力机制本身存在的一些问题进行了深入的研究和实验,通过往整个算法中添加注意力显著图合并算法和结果细化算法进一步提高弱监督目标检测模型的整体效果,本文的主要研究内容和成果如下:1、使用算法模拟了人类在认识事物时使用的注意力机制并将其应用于弱监督目标检测任务,实现了仅使用图像级别标注数据训练高准确度的目标检测模型的目的。2、注意力机制的特点会导致其倾向于局部最优解和...
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 基于多示例学习的弱监督目标检测方法
1.2.2 基于图像分割方法的弱监督目标检测方法
1.2.3 基于卷积神经网络的弱监督目标检测方法
1.3 论文主要研究内容及创新点
1.4 论文章节安排
第2章 基于注意力机制的目标检测模型
2.1 注意力机制介绍
2.2 基于注意力机制的目标检测模型设计
2.2.1 数学原理
2.2.2 网络结构与设计
2.3 注意力显著图的扩充算法
2.4 本章小结
第3章 针对一般目标检测的结果细化算法
3.1 Canny边缘检测算法
3.1.1 高斯滤波
3.1.2 梯度
3.1.3 非极大值抑制
3.1.4 双阈值边缘检测
3.2 基于深度学习的边缘提取算法
3.2.1 候选边缘点筛选
3.2.2 高层次特征提取
3.2.3 边缘检测网络
3.2.4 基于边缘检测结果的一般目标检测结果细化算法
3.3 实验与分析
3.3.1 评价指标
3.3.2 PascalVOC2007目标检测数据集实验
3.3.3 PascalVOC2012目标检测数据集实验
3.3.4 医疗场景弱监督目标检测试验
3.4 本章小结
第4章 针对自然场景文本检测的结果细化算法
4.1 笔画宽度变换算法
4.1.1 算法预处理
4.1.2 笔画宽度变换操作
4.1.3 候选字符分组
4.1.4 文本行聚合
4.2 最大稳定极值区域算法
4.2.1 图像预处理
4.2.2 图像灰度遍历
4.2.3 关键区域判别
4.3 基于统计的文本检测结果细化算法
4.4 实验与分析
4.4.1 评价指标
4.4.2 MSRA-TD500数据集实验
4.4.3 ICDAR2013数据集实验
4.4.4 ICDAR2015数据集实验
4.5 本章小结
第5章 总结与展望
5.1 工作总结
5.2 工作展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
本文编号:3777025
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 基于多示例学习的弱监督目标检测方法
1.2.2 基于图像分割方法的弱监督目标检测方法
1.2.3 基于卷积神经网络的弱监督目标检测方法
1.3 论文主要研究内容及创新点
1.4 论文章节安排
第2章 基于注意力机制的目标检测模型
2.1 注意力机制介绍
2.2 基于注意力机制的目标检测模型设计
2.2.1 数学原理
2.2.2 网络结构与设计
2.3 注意力显著图的扩充算法
2.4 本章小结
第3章 针对一般目标检测的结果细化算法
3.1 Canny边缘检测算法
3.1.1 高斯滤波
3.1.2 梯度
3.1.3 非极大值抑制
3.1.4 双阈值边缘检测
3.2 基于深度学习的边缘提取算法
3.2.1 候选边缘点筛选
3.2.2 高层次特征提取
3.2.3 边缘检测网络
3.2.4 基于边缘检测结果的一般目标检测结果细化算法
3.3 实验与分析
3.3.1 评价指标
3.3.2 PascalVOC2007目标检测数据集实验
3.3.3 PascalVOC2012目标检测数据集实验
3.3.4 医疗场景弱监督目标检测试验
3.4 本章小结
第4章 针对自然场景文本检测的结果细化算法
4.1 笔画宽度变换算法
4.1.1 算法预处理
4.1.2 笔画宽度变换操作
4.1.3 候选字符分组
4.1.4 文本行聚合
4.2 最大稳定极值区域算法
4.2.1 图像预处理
4.2.2 图像灰度遍历
4.2.3 关键区域判别
4.3 基于统计的文本检测结果细化算法
4.4 实验与分析
4.4.1 评价指标
4.4.2 MSRA-TD500数据集实验
4.4.3 ICDAR2013数据集实验
4.4.4 ICDAR2015数据集实验
4.5 本章小结
第5章 总结与展望
5.1 工作总结
5.2 工作展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
本文编号:3777025
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3777025.html