基于眼动数据的分类视觉注意模型
本文关键词:基于眼动数据的分类视觉注意模型,由笔耕文化传播整理发布。
【摘要】:视觉注意是人类视觉系统中的重要部分,现有的视觉注意模型大多强调基于自底向上的注意,较少考虑自顶向下的语义,也鲜有针对不同类别图像的特定注意模型。眼动追踪技术可以客观、准确地捕捉到被试的注意焦点,但在视觉注意模型中的应用还比较少见。因此,提出了一种自底向上和自顶向下注意相结合的分类视觉注意模型CMVA,该模型针对不同类别的图像,在眼动数据的基础上训练分类视觉注意模型进行视觉显著性预测。本文的主要工作有:1.为了训练不同类别图像的视觉注意模型,从多个图像库和网络图像中选出动物、景物、人物和交通工具这四类出现频率较高,有代表性的图像。每一类图像分别进行眼动实验,对实验结果中的焦点图进行高斯卷积得到"ground truth"显著图来显示人眼实际关注的区域,构建四类图像的眼动数据集。2.从每一类图像的"ground truth"显著图中选取正、负样本,对不同类别的图像提取不同的高层特征,主要区别是目标对象检测特征不同,同时提取一系列的底层特征来定义显著位置,用线性支持向量机来训练分类视觉注意模型CMVA。最后与其它8个模型用三个评价指标进行比较分析。为了让未知类别的图像自动选择其对应类别的视觉注意模型,将四类图像作为训练集,标记了四个类别,分别是1、2、3、4。然后提取部分底层特征和高层特征,用SVM的多分类形式训练了一个图像分类器,使未知图像可以得到它所属的类别,进而使用该类的分类视觉注意模型。3.眼动仪进行眼动实验存在一定的误差,为了比较眼动结果训练的模型和真实的显著图得到的模型之间的差距,让被试对四类图像手动标记图像中的感兴趣区域,得到手动的"ground truth"显著图。最后通过评价指标比较眼动模型和手动模型。实验结果表明,与现有的其它8个视觉注意模型相比,该模型的性能优于其它模型。和手动模型相比,性能稍差,但是可以代替人手工标记的繁重,大大地提高了效率,很有研究的价值。
【关键词】:视觉注意 视觉显著性 分类模型 自底向上 自顶向下
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【目录】:
- 致谢5-6
- 摘要6-7
- ABSTRACT7-11
- 1 引言11-15
- 1.1 课题研究的背景与意义11-12
- 1.2 国内外研究发展现状12-13
- 1.3 论文的主要研究工作13-14
- 1.4 论文结构14-15
- 2 视觉注意机制15-27
- 2.1 视觉注意机制的概述15-17
- 2.2 视觉注意机制的研究意义17
- 2.3 视觉注意计算模型—Itti模型17-26
- 2.3.1 特征提取18-22
- 2.3.2 显著图生成22-25
- 2.3.3 注意焦点转移25
- 2.3.4 Itti模型的不足25-26
- 2.4 本章小结26-27
- 3 眼动跟踪和眼动实验27-43
- 3.1 眼球结构与视线定义27-28
- 3.2 眼动的相关介绍28-30
- 3.2.1 眼动的形式28-29
- 3.2.2 眼动的主要测量方法29-30
- 3.3 眼动跟踪技术30-33
- 3.3.1 眼动跟踪技术的基本原理和主要参数30-31
- 3.3.2 眼动跟踪技术的应用31-33
- 3.4 眼动跟踪技术的发展前景33-34
- 3.5 眼动跟踪设备—眼动仪34-36
- 3.5.1 眼动仪的研究现状34
- 3.5.2 SMI眼动追踪系统34-36
- 3.6 眼动实验设计与数据采集36-42
- 3.6.1 眼动实验的眼动仪36-37
- 3.6.2 眼动实验图像采集37
- 3.6.3 眼动实验过程37-40
- 3.6.4 眼动实验结果与数据采集40-42
- 3.7 本章小结42-43
- 4 分类视觉注意模型CMVA43-58
- 4.1 模型的整体框架43-44
- 4.2 特征提取44-48
- 4.2.1 底层(自底向上)特征44-47
- 4.2.2 高层(自顶向下)特征47-48
- 4.3 数据归一化处理48-49
- 4.4 SVM训练模型49-55
- 4.4.1 SVM的理论知识49-54
- 4.4.2 线性支持向量机LSVM训练54-55
- 4.5 基于SVM的多类分类器55-57
- 4.6 本章小结57-58
- 5 实验结果58-66
- 5.1 评价指标58-59
- 5.2 性能分析59-62
- 5.3 手动标记的“ground truth”与眼动实验的区别62-65
- 5.4 本章小结65-66
- 6 总结66-68
- 6.1 本文工作总结66-67
- 6.2 展望67-68
- 参考文献68-71
- 作者简历及攻读硕士学位期间取得的研究成果71-73
- 学位论文数据集73
【相似文献】
中国期刊全文数据库 前10条
1 曾爱华,殷瑞祥,崔海霞;基于小波的图像插值方法[J];河南科技大学学报(自然科学版);2005年02期
2 杨金柱;赵大哲;徐心和;;基于距离场的非线性图像插值分割方法[J];东北大学学报;2006年08期
3 张玉叶;王学伟;王春歆;;图像插值分析的交互式分层复原[J];光电工程;2008年05期
4 王亮;黄晓涛;周智敏;;2维复图像插值技术研究[J];中国图象图形学报;2008年08期
5 符祥;郭宝龙;;图像插值技术综述[J];计算机工程与设计;2009年01期
6 郝鹏威,,朱重光;基于小波的图像插值方法[J];遥感学报;1998年02期
7 邱伟;;浅谈图像插值技术[J];科技致富向导;2011年17期
8 谭璐,吴翊,刘卓;高维图像数据的最优表达[J];国防科技大学学报;2003年05期
9 张辉;胡广书;;基于二维卷积的图像插值实时硬件实现[J];清华大学学报(自然科学版);2007年06期
10 李锌;张飞舟;;基于再生核滤波器的边缘保护图像插值方法[J];计算机工程与应用;2008年13期
中国重要会议论文全文数据库 前4条
1 胡巍;张桂林;陈朝阳;;基于正交函数积分理论的图像插值方法[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
2 姚春莲;高丽华;陈谊;李炜;;基于图像插值的帧内预测[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(上册)[C];2008年
3 肖义男;文玉梅;罗毅;;基于边缘敏感滤波的图像插值模糊消除[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
4 仵冀颖;阮秋琦;;偏微分方程约束的非局部均值图像插值模型[A];第十三届全国图象图形学学术会议论文集[C];2006年
中国重要报纸全文数据库 前1条
1 ;爱国者自然窗330T[N];中国计算机报;2001年
中国博士学位论文全文数据库 前10条
1 魏平;数字乳腺钼靶图像的软拷贝显示技术研究[D];浙江大学;2009年
2 Rukundo Olivier;灰度图像插值优化方法的研究[D];华中科技大学;2012年
3 刘芳;图像可逆信息隐藏技术若干问题研究[D];大连理工大学;2013年
4 刘哲星;医学图像回溯性配准研究[D];第一军医大学;2002年
5 许博谦;星载相机微振动下图像补偿技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2015年
6 付晓薇;基于量子力学的图像处理方法研究[D];华中科技大学;2010年
7 张健;复杂图像文本提取关键技术与应用研究[D];南开大学;2014年
8 冯宇平;图像快速配准与自动拼接技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2010年
9 魏昱;图像显著性区域检测方法及应用研究[D];山东大学;2012年
10 王捷;基于相位信息的TCMR图像心肌运动估计方法研究[D];华中科技大学;2014年
中国硕士学位论文全文数据库 前10条
1 刘雪峗;移动终端图像插值快速算法的研究[D];华南理工大学;2015年
2 翟珍珍;多尺度分析方法在医学影像诊断系统中的应用研究[D];郑州大学;2015年
3 王飞宇;多核图像处理平台及其在夜视图像融合中的应用[D];南京理工大学;2015年
4 王洋;基于多图谱的人脑MR图像的分析与可视化[D];上海交通大学;2015年
5 张向泽;基于图像的景深渲染算法的研究与实现[D];上海交通大学;2015年
6 孟蕊;虚拟试衣系统关键算法研究[D];哈尔滨工业大学;2015年
7 王海雁;多路图像数据集中处理系统设计与开发[D];电子科技大学;2014年
8 郑成龙;基于云计算的脑部MR图像可视化的研究与实现[D];电子科技大学;2014年
9 柳舒怀;基于Hough变换的图像配准算法[D];大连理工大学;2015年
10 王凤娇;基于眼动数据的分类视觉注意模型[D];北京交通大学;2016年
本文关键词:基于眼动数据的分类视觉注意模型,由笔耕文化传播整理发布。
本文编号:280695
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/280695.html