图像场景识别的特征研究

发布时间：2017-09-28 20:00

本文关键词：图像场景识别的特征研究

【摘要】：图像场景识别是根据场景相似性对图像进行分类。人类在完成场景识别时需要深刻理解图像从而形成高层次的抽象概念，而计算机则是直接面向图像的数字存储形式做出判断。人所理解的“概念相似性”与计算机理解的“数字存储形式相似性”之间的“语义鸿沟”（Semantic Gap）是图像场景识别面临的重要问题之一。提取高层次的特征从而深度挖掘图像中的信息可以有效跨越“语义鸿沟”，提高识别准确率。围绕用于图像场景识别的特征研究，论文的主要研究工作如下： 1.提出了一种可高效提取和分类的主题特征（Efficient Topic Feature，E-TF）。目前常见的使用主题模型表达新图像时需要进行主题潜变量推理，因此计算量较大，同时由于主题建模时需要已知标签从而造成标签和特征的耦合。为解决该问题，使用潜在狄利克雷分配(Latent Dirichlet Allocation，LDA)模型的潜变量及其学习算法构造了一种主题表示，并通过主题模型的潜变量进一步提出了可高效提取和分类的主题特征。该主题特征在所有类别中共享主题空间，提取过程无需类别标签，从而避免了特征与标签的耦合；对图像码字进行简单的线性映射即可完成E-TF的提取，从而大幅减小了计算量。通过类似的实验条件对比了其它三种相似特征，并在15-Scenes数据集上对比了pooling方法，，结果表明E-TF可以获得更高的识别准确率。 2.提出了低维目标属性（Low Dimensionality Object Bank，LD-OB）特征。目标属性特征是图像的一种高层特征，具有很高的识别准确率，然而其维度过高导致分类运算的计算量过大，现有的降维方法不能兼顾大幅降低维度与提高识别率两个指标。针对该问题，提出一种低维目标属性特征，通过pooling方法简化目标属性特征的模式从而大幅降低了维度，并且采用两个优化策略提高识别准确率。为了验证LD-OB特征的有效性，在三个真实场景数据集上对其进行了评估：事件类UIUC-Sports数据集、自然场景LabelMe数据集、室内室外混合场景15-Scenes数据集。实验结果表明，LD-OB特征不仅可以显著降低目标属性特征的维度，且具有更高的识别准确率。计算复杂度的分析表明该特征可以有效降低分类的时间复杂度。 3.提出了一种基于快速稀疏编码（Fast Sparse Coding，F-SC）的中间层特征。稀疏编码的词典学习需要词典更新步骤和码字分配步骤两个凸优化问题解的相互迭代，因此具有很大的计算量。为了对词典学习步骤进行优化，改进了稀疏编码算法的词典学习步骤，并由此建立了一种中间层特征。F-SC算法按照与码字分配无关的规则寻找一系列最具有代表性的样本作为词典分量，使用k-means++算法求取初始化样本，然后使用k-mediods聚类算法搜索有代表性的样本，最终使用搜索到的样本构造词典进行稀疏编码。改进的词典更新步骤独立于稀疏编码的码字分配步骤，避免了两个凸优化问题解的相互迭代，因此可以有效降低词典学习的计算复杂度。使用F-SC算法提取中间层特征，并进行空间金字塔建模，在Caltech-101数据集、15-Scenes数据集和UIUC-Sports数据集上与其它空间金字塔方法展开了对比实验，结果表明基于F-SC算法的中间层特征可以有效提高识别准确率。
【关键词】：图像场景识别 LDA(Latent Dirichlet Allocation) 主题特征 目标属性特征 稀疏编码 空间金字塔
【学位授予单位】：吉林大学
【学位级别】：博士
【学位授予年份】：2015
【分类号】：TP391.41
【目录】：

摘要4-6
Abstract6-12
第1章绪论12-18
1.1 课题的研究背景及意义12-13
1.2 图像场景识别的研究现状13-16
1.3 论文的研究内容16-17
1.4 论文的组织结构17-18
第2章图像场景识别中各层特征18-32
2.1 底层局部特征18-23
2.1.1 尺度不变特征变换描述符18-21
2.1.2 方向梯度直方图特征21-23
2.2 中间层特征23-27
2.2.1 基于词袋模型的中间层特征23-24
2.2.2 基于稀疏编码的中间层特征24-25
2.2.3 基于局部可变模型的中间层特征25-27
2.3 高层特征27-30
2.3.1 基于主题模型的高层特征27-29
2.3.2 基于空间金字塔的高层特征29-30
2.4 本章小结30-32
第3章可高效提取和分类的主题特征32-50
3.1 引言32-33
3.2 主题模型与特征提取算法33-39
3.2.1 特征与码书34-35
3.2.2 模型结构35-36
3.2.3 参数估计—Gibbs 采样36-38
3.2.4 图像表示与主题特征38-39
3.3 主题模型用于场景识别的相关研究39-40
3.4 对比实验及结果分析40-46
3.4.1 实验条件40-41
3.4.2 LabelMe 和 UIUC-Sports 数据集41-44
3.4.3 15-Scenes 数据集44-46
3.5 可高效提取和分类的主题特征讨论46-48
3.6 本章小结48-50
第4章低维目标属性特征50-74
4.1 引言50-52
4.2 基于目标属性的图像场景识别相关工作52-53
4.3 Object Bank 特征53-56
4.3.1 目标滤波器及其响应53
4.3.2 由响应值生成 OB 描述符53-55
4.3.3 现有的 OB 降维特征55-56
4.4 低维目标属性特征的提取模型与算法56-62
4.4.1 合并特征的层次与尺度56-58
4.4.2 模式分析与 pooling 降维理论58-60
4.4.3 目标属性特征的降维算法60-62
4.5 对比实验及结果分析62-66
4.5.1 UIUC-Sports 数据集63-65
4.5.2 LabelMe 数据集65
4.5.3 15-Scenes 数据集65-66
4.6 低维目标属性特征分析66-72
4.6.1 关键策略的作用66-68
4.6.2 算法复杂度68-69
4.6.3 空间信息69-72
4.7 本章小结72-74
第5章基于快速稀疏编码的中间层特征74-88
5.1 引言74-75
5.2 基于快速稀疏编码的相关研究75-76
5.3 稀疏编码的模型与算法76-80
5.3.1 稀疏编码的模型假设76-78
5.3.2 基于符号搜索的码字分配算法78-79
5.3.3 拉格朗日乘数法更新词典79-80
5.4 快速稀疏编码80-82
5.4.1 词典学习的模型假设80
5.4.2 快速词典学习算法80-82
5.5 对比实验及结果分析82-87
5.5.1 Caltech-101 数据集83-85
5.5.2 15-Scenes 数据集85-86
5.5.3 UIUC-Sports 数据集86-87
5.6 本章小结87-88
第6章全文总结88-92
6.1 论文工作总结88-89
6.2 工作展望89-92
参考文献92-106
作者简介及科研成果106-108
致谢108-109

【参考文献】

中国期刊全文数据库前1条

1 徐戈;王厚峰;;自然语言处理中主题模型的发展[J];计算机学报;2011年08期

本文编号：937754

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/shoufeilunwen/xxkjbs/937754.html

上一篇：基于冲击声的声源物理属性辨识及声线索提取
下一篇：基于位置社交网络的地点推荐方法及应用研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|