特定场景下的可变形部件模型
发布时间:2017-10-31 01:06
本文关键词:特定场景下的可变形部件模型
更多相关文章: 物体检测 概率图模型 可变形部件模型 场景相关特征 加速算法
【摘要】:物体检测长期以来都是计算机视觉中的基本问题之一,是进行场景理解,行为分析的基础,在视频监控、自动驾驶系统、机器人制造等问题中得到了广泛的应用。当前主流的检测算法采用基于滑动窗口的检测策略:从滑动窗口中提取特征,将检测问题转化为二值分类问题,即判断待检测目标是否存在于当前窗口中。由于物体的视觉特征会随着视角、光照、姿态等条件的变化而变化,给检测任务带来了很大的难度。大多数检测算法关注的是静态图像的检测,而特定场景下的物体检测又带来了新的挑战:首先,物体尺度范围非常大,滑动窗口大小的选择需要平衡,若窗口过大,则对小尺度目标容易产生漏检;若窗口过小,则容易产生虚检;其次,现实世界中的物体纷繁复杂,小尺度物体的视觉信息不足,极易产生漏检或者与背景发生混淆。训练时间也是检测模型的一大瓶颈,模型的泛化能力有限,针对特定场景训练的检测难以迁移到新的场景。针对上述问题,我们拟利用特定场景提供的上下文信息,采用场景相关特征提高检测精度,将可变形部件模型扩展到多尺度结构,使用概率图模型结合检测模型和场景相关特征进行联合估计。本文的主要研究工作如下:1.分析了特定场景下物体检测问题的难点:物体尺度变化及复杂背景带来的干扰。针对特定场景,在传统的基于局部图像信息的检测策略的基础上,采用基于上下文信息的检测思路,充分利用场景所提供的相关信息,提升检测精度。提出了将可变形部件模型作为局部检测器,使用概率图模型将局部检测器与场景相关的上下文特征结合的特定场景可变形部件模型。2.对物体检测加速算法进行了研究。通过性能分析发现,滤波器与图像特征图的卷积运算是检测过程中耗时最长的部分,即算法性能瓶颈所在。将基于频域加速的卷积加速算法应用于可变形部件模型上,分析了传统卷积算法和频域加速算法的时间复杂度,并进行了实现。3.在两个特定场景公共数据集CAVIAR和LISA上进行了实验,从检测准确率和检测算法效率两个角度对实验结果进行了分析,实验结果证明了使用场景相关信息能够提升检测准确率,同时频域卷积加速算法能够有效提升算法效率。
【关键词】:物体检测 概率图模型 可变形部件模型 场景相关特征 加速算法
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
- 摘要3-5
- ABSTRACT5-11
- 第一章 引言11-15
- 1.1 研究背景及意义11-12
- 1.2 本文主要工作12-13
- 1.3 章节安排13-15
- 第二章 物体检测算法综述15-29
- 2.1 研究问题及其难点15-18
- 2.2 研究现状18-22
- 2.2.1 主流物体检测数据库18-19
- 2.2.2 PASCAL竞赛物体检测项目优胜算法回顾19-22
- 2.3 典型物体检测系统框架22-28
- 2.3.1 特征提取23-24
- 2.3.2 机器学习算法24-28
- 2.4 本章小结28-29
- 第三章 可变形部件模型29-43
- 3.1 可变形部件模型29-31
- 3.2 物体检测31-32
- 3.3 混合分量32-33
- 3.4 隐变量支持向量机33-37
- 3.4.1 半凸性33-34
- 3.4.2 随机梯度下降法34
- 3.4.3 适用于SVM的困难样本挖掘算法34-35
- 3.4.4 适用于LSVM的困难样本挖掘算法35-37
- 3.5 模型训练37-39
- 3.5.1 参数学习37-38
- 3.5.2 初始化38-39
- 3.6 改进的HOG特征39-41
- 3.7 后处理41-42
- 3.7.1 包围盒预测41-42
- 3.7.2 非极大值抑制42
- 3.8 本章小结42-43
- 第四章 特定场景下的可变形部件模型43-54
- 4.1 多尺度可变形部件模型44-47
- 4.1.1 单一分辨率检测模型44-45
- 4.1.2 多个单一分辨率检测模型45-46
- 4.1.3 多尺度可变形部件模型46-47
- 4.2 场景相关特征47-48
- 4.2.1 地平面估计47-48
- 4.2.2 物体位置估计48
- 4.3 图模型框架48-49
- 4.4 频域卷积加速算法49-52
- 4.4.1 卷积运算的时间复杂度分析50
- 4.4.2 基于快速傅里叶变换的加速算法50-51
- 4.4.3 特征金字塔拼接51-52
- 4.5 本章小结52-54
- 第五章 实验结果与分析54-63
- 5.1 实验环境及数据集介绍54-55
- 5.1.1 实验软件及硬件环境54
- 5.1.2 数据集54-55
- 5.2 检测准确率55-59
- 5.2.1 评价指标55-56
- 5.2.2 CAVIAR视频监控数据集检测结果56-59
- 5.3 场景迁移能力59-61
- 5.4 卷积加速61-62
- 5.5 本章小结62-63
- 第六章 总结与展望63-66
- 6.1 本文总结63
- 6.2 今后工作和展望63-66
- 参考文献66-71
- 致谢71-72
- 攻读硕士学位期间已发表或录用的论文72-74
【参考文献】
中国期刊全文数据库 前1条
1 黄凯奇;任伟强;谭铁牛;;图像物体分类与检测算法综述[J];计算机学报;2014年06期
,本文编号:1120092
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1120092.html