基于视觉认知的目标识别技术研究

发布时间:2017-03-17 15:07

  本文关键词:基于视觉认知的目标识别技术研究,,由笔耕文化传播整理发布。


【摘要】:在机器学习、模式识别和计算机视觉等领域,目标识别一直是最具挑战性的难题之一。研究目标识别技术是解决目标跟踪、行为理解和场景分析等复杂视觉任务的基础,具有重要的实用价值和理论指导意义,已成为非常重要的研究热点和难点。目标识别是利用计算机对图像进行处理、分析和理解,获取感兴趣的目标或区域相关信息的技术。研究目标识别技术的最终目标是,使计算机像人脑视皮层一样快捷高效地“读懂”图片的内容,引领我们进入更加智能的未来。这也促进了对生物视觉认知机制及其智能性进行研究的兴趣。尤其是在复杂恶劣环境下,需要处理视觉信息时,传统的基于统计学习的计算机视觉方法遇到较大困难。鉴于此,如何从视觉认知的角度去研究和设计计算机视觉算法成为一项迫切而又富有挑战性的任务。本文主要针对生物视觉认知系统的关键环节—分层最大化和学习机制开展研究工作,在深刻理解其运行机制和原理的基础上,将其运用于目标分类、识别系统,并在静态2D图像数据集和连续帧2D图像数据集上对优化的算法模型进行性能评估和分析,取得了重要的进展。首先,研究了两个经典的基于生物视觉的计算模型HTM(分层时序模型)和HAMX(分层最大化模型)。然后,结合视觉认知机制重新设计优化了传统的计算机视觉模型。具体研究内容如下:(1)针对传统目标识别模型存在通用性差、目前尚未与视觉认知机制有效结合等难题,首先对HMAX和HTM两个仿脑模型进行了计算理论层次与算法设计层次上的分析,指出其本质上和计算机视觉模型的原理对应关系。然后,详细分析了视觉认知理论在目标分类、识别中的应用。(2)针对光照突变导致识别时检测率低的问题,提出结合优化的同态滤波算法,设计了基于Patch的更具区分性的LBP特征,改进后的算法应用于目标识别系统,实验结果验证了优化后算法的有效性和可行性。(3)针对遮挡情况下,有效检测目标,并同时能识别出遮挡目标的可见部分是目前面临的一个主要挑战,研究该方向有具有一定的理论指导意义和实际工程价值。针对上述难点本文提出结合外观特征和帧间运动信息对目标进行显式遮挡建模的方法。该方法将基于单帧的部件级目标检测与基于连续帧的目标遮挡估计相融合,解决了因为可利用信息不足导致识别性能不高的难题,有效提升了遮挡情况下的目标检测率。(4)针对传统的视皮层前馈分层模型仅局限于探讨目标分类问题,提出了一种面向多视角目标检测的视皮层前馈分层模型。该模型采用基于视角的目标表达方法,通过增加一个简单单元层来表达目标的不同视角,增加一个复杂单元层来表达不同视角简单单元的投票结果,从而完成视角不变的目标检测。学习方面,在原有的底层特征分片学习的基础上,该模型在高层增加了对视角的学习,从而形成一个两层的学习结构,这一结构可以有效的提高学习的效率。在PASCAL VOC2011数据集上的测试结果表明,改进后的模型性能与传统的计算模型相比,取得了更好的检测效果。(5)针对被检测目标在视角变化和遮挡时较难识别的问题,提出利用多特征融合的方式来降低视角的干扰,联合利用Gabor特征和视角变换时共有的LIOP特征(Local Intensity Order Pattern)对目标进行多角度识别的新算法。首先,利用二维Gabor滤波器组对输入图像进行滤波,得到含有方向信息的Gabor特征响应图,进而通过相关算法得到具有尺度及平移不变的特征向量。其次,通过几何变换算法获得不同视角下的LIOP特征向量。然后,为了降低时间复杂度,通过主成分分析算法(principal component analysis)对联合特征降维。最后,把降维后的特征向量输入支持向量机(SVM)进行训练学习,得到检测器模型。综上,本文针对在复杂场景下,传统目标识别存在一定局限性的问题,围绕如何利用、模拟生物视觉认知机制的特性。对传统的目标分类、识别领域等关键问题和算法模型进行探索和指导,初步实现了基于视觉认知的目标识别功能,完成课题既定研究任务,并取得了阶段性成果。为进一步的算法研究提供了理论基础,对研究生物视觉和计算机视觉也具有一定的借鉴意义。
【关键词】:视觉认知 目标识别 复杂场景 分层最大化 机器学习 多视角
【学位授予单位】:电子科技大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
  • 摘要5-7
  • ABSTRACT7-13
  • 第一章 绪论13-32
  • 1.1 课题研究背景意义13-15
  • 1.2 国内外研究现状与发展趋势15-28
  • 1.2.1 问题描述15-18
  • 1.2.2 在计算机视觉领域目标识别技术的研究现状18-23
  • 1.2.3 在生物视觉领域目标识别技术的研究现状23-28
  • 1.3 本文主要研究内容28-30
  • 1.4 本文的组织结构30-32
  • 第二章 视觉认知特性和计算视觉模型32-44
  • 2.1 人类视觉认知处理机制32-36
  • 2.2 特征和统计学习模型36-39
  • 2.3 基于视觉认知的计算模型39-42
  • 2.3.1 神经网络模型39-40
  • 2.3.2 HTM模型40-41
  • 2.3.3 深度学习41-42
  • 2.4 本章小结42-44
  • 第三章 适应光照突变的目标识别44-54
  • 3.1 同态滤波处理光敏感44-45
  • 3.2 局部二值模式(LBP)纹理特征45-47
  • 3.3 自适应阈值和LBP联合特征47-49
  • 3.4 算法评价标准49-51
  • 3.5 实验结果与分析51-53
  • 3.6 本章小结53-54
  • 第四章 基于外观和运动信息的目标识别54-64
  • 4.1 相关研究工作54-55
  • 4.2 基于外观信息的部件级目标检测55-57
  • 4.2.1 训练部分目标检测器55-56
  • 4.2.2 基于语义部件的重评分56-57
  • 4.3 基于运动信息的遮挡估计57-61
  • 4.3.1 光流图像的分割58-59
  • 4.3.2 遮挡估计59-61
  • 4.4 实验结果与分析61-63
  • 4.5 本章小结63-64
  • 第五章 基于视皮层前馈模型的目标识别64-76
  • 5.1 相关工作研究64-66
  • 5.2 HMAX模型理论基础66-67
  • 5.2.1 S1层简单特征66-67
  • 5.2.2 C1层复杂特征67
  • 5.2.3 S2层合成特征67
  • 5.2.4 C2层综合特征67
  • 5.3 基于HMAX模型的多视角目标识别67-68
  • 5.3.1 简单单元层68
  • 5.3.2 复杂单元层68
  • 5.4 基于视觉不变性的训练学习68-71
  • 5.4.1 S2层的特征分片学习69-70
  • 5.4.2 S3层的视角学习70-71
  • 5.5 实验结果与分析71-74
  • 5.6 本章小结74-76
  • 第六章 基于Gabor和LIOP特征的多视角目标识别76-87
  • 6.1 引言76-77
  • 6.2 多视角检测系统工作原理与分析77-82
  • 6.2.1 Gabor特征提取77-79
  • 6.2.2 共有LIOP特征提取79-80
  • 6.2.3 特征降维80-82
  • 6.3 分类器设计82-83
  • 6.4 实验结果与分析83-86
  • 6.5 本章小结86-87
  • 第七章 总结与展望87-90
  • 7.1 工作与总结87-88
  • 7.2 本文主要创新点88-89
  • 7.3 深入与展望89-90
  • 致谢90-92
  • 参考文献92-106
  • 攻博期间取得的研究成果106-107

  本文关键词:基于视觉认知的目标识别技术研究,由笔耕文化传播整理发布。



本文编号:253060

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/253060.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户526dc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com