生物视觉感知启发下的目标检测与识别技术研究
本文选题:目标检测与识别 + 视觉感知系统视觉感知双通路结构 ; 参考:《华中科技大学》2015年博士论文
【摘要】:人类视觉感知系统能够轻易地从外部复杂场景中感知静止或运动的目标,然而该感知过程对计算机来说并非易事。作为计算机视觉领域中的研究热点和难点之一,目标检测与识别长期以来受到了众多学者的关注,具有重要的学术研究价值。目标检测与识别是视频监控、智能交通、遥感测绘等应用领域的核心技术,具有广泛的应用前景。近年来,大量的自动目标检测与识别算法被提出,一定程度上提高了机器视觉感知系统的智能化水平。然而,机器视觉感知水平还远远落后于人类视觉的感知能力。鉴于这一现状,借鉴神经科学和认知心理学的研究成果,模拟生物视觉感知过程来建立目标检测与识别算法,是一个能极大程度提高目标检测与识别性能的研究和探索方向。 在生物视觉感知特性启发下,本文开展了一系列目标检测与识别技术研究,着重研究了空间显著目标检测技术、时空显著目标检测技术、机载红外运动目标检测技术和无监督层次化特征提取及其在分类识别中的应用技术,具体内容如下: (1)基于选择性视觉注意中的感觉增强理论,提出了一种基于柯西图嵌入的目标空间显著性计算方法。感觉增强理论表明目标的注意是注意焦点扩散的结果。基于这一理论,该方法以经典注意焦点预测方法为输入,利用基于柯西图嵌入的平滑约束对输入结果进行平滑、完成视觉组织过程,用以模拟注意焦点的扩散过程。实验结果表明基于柯西图嵌入的视觉组织优于传统的拉普拉斯图嵌入,可以大大提高原输入方法的显著目标预测性能,并且最终结果达到与已有专注于显著目标检测的方法可比的性能。 (2)在视觉感知双通路结构启发下,提出了一种基于混合特征核回归模型的目标时空显著性计算方法。视觉感知双通路假设被普遍接受:视觉感知首先沿着腹部流通路和背部流通路分别进行,最终完成信息整合。在这一视觉感知流程启发下,提出的时空显著性计算方法包括三个主要模块:空域显著性计算对应腹部流通路的外观感知功能;时域显著性计算对应背部流通路的运动感知功能:时空显著性融合对应双通路的信息整合功能。为了应对时空显著性的融合问题,首次提出混合特征空间核回归模型诱导下的三种估计子,包括常数估计子、线性估计子和非线性估计子。结合三种估计子,创造性的提出了一种混合融合算法。实验结果表明所提出的混合融合算法明显优于已有时空显著性融合算法。得益于该混合融合算法,所提出的时空显著性计算方法取得比已有方法更好的性能。 (3)在背部流感知通路反馈连接启发下,提出了一种多级处理算法来解决机载红外运动目标检测问题。大量的神经生理学实验表明负责运动信息处理的背部流通路的处理速度远远快于负责外观信息处理的腹部流通路,并且呈现出明显的背部流通路反馈调节腹部流通路的特性。在这一不对称连接特性启发下,提出一种实时机载红外运动目标检测算法,主要包括三级处理流程:快速运动感知;候选运动焦点及运动窗获取;运动窗内目标精确提取。实验结果表明提出的多级处理算法在计算效率和检测精度两方面都优于已有的算法。 (4)在视皮层层次化感知特性启发下,提出了一种无监督层次化特征提取方法并应用于目标和场景分类识别任务。大量的神经生理学证据表明人类具有优越的目标感知和判别能力是因为视皮层的不同皮层区域能够响应由低级到高级不断抽象的特征。具体来说,初级视皮层V1区细胞对类Gabor滤波器的低阶边缘比较敏感,而高级视皮层V2区细胞对高阶的角点、连接点等特征比较敏感。从可视结果来看,所提出的层次化特征提取方法中的第一级特征表达的基函数类似于V1区细胞响应,并且第二级特征表达的基函数类似于V2区细胞响应。该特征提取方法在10类目标分类任务的CIFAR-10数据库和21类遥感影像场景分类任务的UCM-21数据库上,均取得了理想的分类效果。
[Abstract]:In recent years , a large number of automatic target detection and recognition algorithms have been put forward in order to improve the intelligence level of the machine vision perception system .
In the light of biovisual perception , a series of target detection and recognition techniques are studied in this paper , focusing on the research of the techniques of spatial salient object detection , space - time salient object detection , airborne infrared moving target detection and non - supervised hierarchical feature extraction and its application in classification recognition , which are as follows :
( 1 ) Based on the perception enhancement theory in selective visual attention , a method for calculating the target spatial significance based on Cauchy ' s embedding is presented . Based on this theory , the method is based on the classical focus prediction method , which is used to simulate the diffusion process of focus . The experimental results show that the embedded visual organization is superior to the traditional Laplacian image embedding , which can greatly improve the prediction performance of the original input method .
( 2 ) In the light of the visual perception double - path structure , a method for calculating the objective time - space significance based on the hybrid characteristic kernel regression model is proposed . The visual perception double - path assumption is generally accepted : the visual perception is firstly carried out along the abdomen flow path and the back flow path respectively , and finally the information integration is finished . Under the inspiration of this visual perception process , the proposed temporal and spatial significance calculation method comprises three main modules : the airspace significance calculation corresponds to the appearance perception function of the abdominal flow path ;
In order to solve the fusion problem of space - time significance , three kinds of estimation sub - parameters , including the constant estimator , the linear estimator and the non - linear estimator , are proposed for the first time in order to deal with the fusion problem of space - time significance . The results show that the proposed hybrid fusion algorithm is superior to the existing spatial - temporal significance fusion algorithm .
( 3 ) Inspired by the feedback connection of the back flow sensing path , a multi - level processing algorithm is proposed to solve the airborne infrared motion target detection problem . A large number of neurophysiology experiments show that the processing speed of the back flow path for the motion information processing is much faster than that of the abdominal flow path responsible for the appearance information processing .
candidate motion focus and motion window acquisition ;
The experimental results show that the proposed multi - level processing algorithm is superior to the existing algorithms in terms of efficiency and precision .
( 4 ) Based on the hierarchical cognitive characteristics of visual cortex , a hierarchical feature extraction method is proposed and applied to target and scene classification recognition tasks .
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 刘利刚;;打造学术一流的联合实验室——浙江大学视觉感知教育部-微软重点实验室[J];计算机教育;2007年11期
2 柯尔挺;厉力华;刘伟;徐伟栋;张娟;张凌男;ZHENG Bin;;基于视觉感知信息的乳腺钼靶肿块检测分析与自动提取[J];中国生物医学工程学报;2014年01期
3 魏政刚,袁杰辉,蔡元龙;一种基于视觉感知的图像质量评价方法[J];电子学报;1999年04期
4 杨建国,肖永剑,王兆安;交通微观仿真中的驾驶员视觉感知模型[J];系统仿真学报;2005年10期
5 周静;;富士施乐开发出基于人类视觉感知的全新图像编辑技术[J];计算机与网络;2014年14期
6 辜小花;;基于视觉感知和边缘保持的光照不变人脸识别[J];电子学报;2013年08期
7 刘明晶,叶懋冬,刘国栋,李澄清;一种基于视觉感知的图像质量评价方法[J];计算机工程与设计;2005年02期
8 毕雁冰;;可行区域视觉感知的一种设置方法[J];机电产品开发与创新;2008年01期
9 陶超;谭毅华;蔡华杰;田金文;;符合人类视觉感知的图像对象分割方法[J];计算机工程;2010年24期
10 董天阳;范允易;范菁;;保持视觉感知的三维树木叶片模型分治简化方法[J];计算机辅助设计与图形学学报;2013年05期
相关会议论文 前5条
1 王书荣;;眼睛运动及其对视觉感知的影响[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
2 薛青;徐文超;郑长伟;刘永红;;基于有限理性的虚拟视觉感知因子分析[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
3 杨敏;梁玮;李善青;贾云得;;一种基于交互式学习的穿戴视觉感知方法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
4 蒲翠翠;孟放;姜秀华;高慧;;一种基于视觉感知的视频质量客观评价方法[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
5 廖毅;程志全;党岗;;一种基于显著性分析的网格分割算法[A];中国图学新进展2007——第一届中国图学大会暨第十届华东六省一市工程图学学术年会论文集[C];2007年
相关重要报纸文章 前2条
1 田学科;原有记忆会降低视觉感知能力[N];科技日报;2011年
2 刘孝沅;用视觉感知的新闻[N];中国新闻出版报;2003年
相关博士学位论文 前10条
1 李彦胜;生物视觉感知启发下的目标检测与识别技术研究[D];华中科技大学;2015年
2 杨恒伏;结合视觉感知的图像认证与数据隐藏算法研究[D];湖南大学;2009年
3 聂一鸣;高速公路自主驾驶汽车视觉感知算法研究[D];国防科学技术大学;2012年
4 郑雅羽;基于视觉感知的H.264感兴趣区域编码研究[D];浙江大学;2008年
5 向遥;基于视觉感知的图像处理方法研究[D];中南大学;2011年
6 杨文璐;视觉感知模型与编码算法研究[D];上海交通大学;2008年
7 杜兴;视觉感知机制启发的人脸识别方法研究[D];重庆大学;2012年
8 于江波;视觉感知计算模型若干问题的研究及其应用[D];北京交通大学;2007年
9 沈云涛;基于视觉感知特性的图像检索研究[D];西北工业大学;2005年
10 李晓华;显示系统分辨率和动态伪像测量评估研究[D];东南大学;2006年
相关硕士学位论文 前10条
1 肖燕霞;基于视觉感知的行为识别方法的研究与实现[D];电子科技大学;2014年
2 周圣云;基于视觉感知的室内场景识别与理解[D];电子科技大学;2015年
3 范允易;轻量级的三维树木构建技术及应用[D];浙江工业大学;2012年
4 姜丽颖;生物视觉感知机制启发下的图像不变性特征表示方法研究[D];中国石油大学(华东);2014年
5 汤毓婧;基于人脑视觉感知机理的分类与识别研究[D];南京理工大学;2009年
6 李双;乳腺钼靶诊断中的视觉感知研究[D];杭州电子科技大学;2011年
7 林祥明;人类视觉感知经验的数学化表示及其在深度估算中的应用[D];复旦大学;2010年
8 宋磊;基于视觉感知的模型简化算法研究与实现[D];大连理工大学;2006年
9 彭素静;基于视觉感知机理的显著区域研究[D];重庆大学;2009年
10 陈金龙;面向图像处理应用的生物视觉感知计算模型研究[D];杭州电子科技大学;2014年
,本文编号:1754496
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1754496.html