主题模型与眼动分析在场景分类中的研究及应用
发布时间:2017-11-11 00:01
本文关键词:主题模型与眼动分析在场景分类中的研究及应用
【摘要】:场景分类是场景理解中的一个基本问题,它主要用于自动标注图像所属的场景类别。为了实现场景分类,通常需要完成两部分工作:图像特征的提取和表示;选择合适的算法和分类器。本文的研究工作主要集中在第一部分。使用单尺度的方法对图像进行局部特征提取时,如果尺度过大,则会包含一些冗余信息;而如果尺度过小,则会丢失图像邻域之间固有的空间结构信息。为此,本文提出一种基于多尺度的方法,即对图像不同位置的子区域采用不同的尺度来进行特征提取。此外,我们还提出使用分类别多次聚类的方法来优化特征词典的构建。使用LDA主题模型来进行的实验证明了本文提出的方法是有效的。在场景分类时,通常都需要对图像的全部区域进行特征提取。但过多的数据会导致分类方法效率较低,也会带来一些噪声。我们知道,人的视觉注意力很容易被场景中的显著区域所吸引,因此人的视觉注视区域与显著性存在一定的相关性。而这种高级的认知行为可以通过眼动信息反映出来。因此本文又提出将眼动信息引入图像的特征提取阶段,从而得到每幅图像的显著区域,并对其进行分类。使用空间金字塔匹配模型和支持向量机来进行的分类实验结果显示,我们的模型在一些场景中取得了比较好的分类效果;而且整个模型在参数学习和测试这两个部分的效率有了明显提升。在模型部分引入眼动信息并且取得一定提升的基础上,我们尝试从自顶向下的视角,利用眼动分析来探讨人类对场景的认知机理,为此我们进行了两个眼动实验。在实验数据的基础上,我们从视觉注视区域的位置分布及图像熵、视觉注视点的停留时间、眼动路径等方面分析了人眼的视觉注视机制。分析表明,眼动的关注区域不仅具有极大的信息量,而且与场景类别特征存在很大的相关性,这就为进一步建立符合人类视觉认知机理的场景分类模型提供了论证依据。
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41
【参考文献】
中国期刊全文数据库 前8条
1 苏煜;山世光;陈熙霖;高文;;基于全局和局部特征集成的人脸识别[J];软件学报;2010年08期
2 曹健;王武军;韩飞;刘玉树;;基于局部特征的目标识别技术研究[J];计算机工程;2010年10期
3 王爱平;张功营;刘方;;EM算法研究与应用[J];计算机技术与发展;2009年09期
4 王福兴;田宏杰;申继亮;;场景知觉及其研究范式[J];心理科学进展;2009年02期
5 王强;陈欢欢;王s,
本文编号:1168900
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1168900.html