基于稀疏表征和自相似性的视觉数据识别关键技术及应用
本文关键词:基于稀疏表征和自相似性的视觉数据识别关键技术及应用,,由笔耕文化传播整理发布。
【摘要】:随着互联网及多媒体技术的迅猛发展,数字图像、视频等视觉数据呈现爆炸式增长,深刻影响着人类社会的方方面面。面对互联网上的海量视觉数据,如何利用计算机代替人类对其进行智能化处理与理解,已经成为一种迫切的需求。视觉数据识别技术作为计算机智能视觉分析中的关键技术,尽管目前已经取得一定研究进展,但是在实际应用中仍然受到光照变化、视角变化、遮挡等多方面环境因素的阻碍。因此,寻求有效的视觉特征表示方法成为视觉数据识别中的核心问题。稀疏表示及纹理特征是当前非常流行的两种视觉特征表示方式,也是本文的主要研究对象。视觉数据能够在特定变换域中得到稀疏表示,是视觉稀疏表示理论的基本假设;这一观点也被人眼视觉感知机理的相关研究成果所部分支持。目前基于信号稀疏表征的机器学习方法在计算机视觉及模式识别领域中备受关注,并在诸多视觉数据识别应用中取得良好的效果,但仍然有很大提升空间。此外,由于纹理在各类视觉数据中无处不在,因此对其进行有效分析描述是视觉数据识别任务的基础性研究课题。虽然过去取得不少研究成果,但是在纹理区分能力及对各种环境变化的鲁棒性方面,当前纹理描述方法还有待改善。本文以视觉特征表示为主线,以稀疏编码、局部模式编码及分形分析为工具,对视觉数据识别的若干关键技术及其应用进行研究探讨。本文的主要研究内容与创新点如下:1.本文提出一种基于迭代重加权l2,1最小化的结构化稀疏编码方法(Reweighted l2,1 minimization based dictionary learning for Structured Sparse Coding, RL21-SSC).RL21-SSC方法通过使用迭代重加权而非标准l2,1范数对每个类别的样本表示进行结构化稀疏约束,可以有效防止稀疏表示大系数上的偏置。而且,RL21-SSC方法所学到的字典能够自适应于每个类别样本所处的子空间,从而促使不同类别拥有不同的结构化稀疏模式。同时,RL21-SSC方法在人脸识别、场景分类及行为识别上的一系列实验中取得了良好的分类效果。2.本文提出一种基于分类器集成的有监督稀疏编码方法(Ensemble Classifier based Dictionary Learning, ECDL/EasyDL)。EasyDL方法通过把子空间集成学习嵌入到有监督稀疏编码中,实现字典学习与集成分类器训练的耦合。而且,通过EasyDL方法所产生的稀疏表示,具有很强的可区分性与较弱的训练数据特性依赖性。针对EasyDL模型,本文提出一种有效的数值解法,从而实现字典与集成分类器的同时更新。在一系列视觉数据识别任务中,EasyDL方法取得比很多经典有监督稀疏编码方法更优秀的分类性能。3.本文提出一种基于层次组稀疏性的判别结构化稀疏编码方法(Collaborative HIerarchicaL Discriminative Dictionary Learning, CHILD-DL)。CHILD-DL方法通过在目标函数中引入类相关的层次结构稀疏正则项,使得同类样本在分组层面上拥有相同的稀疏模式的同时在个体层面上容许稀疏模式存在差异。同时,CHILD-DL方法通过在字典学习过程中嵌入线性分类器训练,进一步提高了稀疏表示的可区分性。针对人脸识别、物体识别及场景分类等应用,本文将CHILD-DL方法与几个国际领先的判别稀疏编码方法进行实验对比,实验结果验证了其有效性。4.本文提出一种基于间隙度分析的静态纹理特征描述子,即模式间隙度谱(Pattern Lacunarity Spectrum, PLS)。PLS描述方法对纹理图像应用旋转不变等价局部二值模式算子,并通过使用间隙度分析对所得到的局部模式在空域上分布的自相似性行为进行刻画,得到该图像的特征表示。同时,PLS描述方法在四个公开静态纹理数据集上的分类实验中,都取得国际一流的分类效果。5.本文提出一种基于间隙度分析的动态纹理特征描述子,即时空模式间隙度谱(Space-Time Pattern Lacunarity Spectrum, ST-PLS)。ST-PLS描述方法通过在动态纹理序列在三个正交时空平面上的二维切片上应用两种有效的局部模式编码策略,并通过间隙度分析对时空局部二值模式在三个时空平面上分别表现出的统计自相似性进行刻画,得到该动态纹理的特征表示。同时,ST-PLS描述方法在两个基准动态纹理数据集上的分类实验中,都取得国际一流的分类效果。
【关键词】:视觉数据识别 稀疏表示 字典学习 结构化稀疏性 有监督学习 纹理描述 间隙度分析
【学位授予单位】:华南理工大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
- 摘要5-7
- Abstract7-13
- 第一章 绪论13-24
- 1.1 研究背景与研究内容13-15
- 1.2 研究意义及应用前景15-17
- 1.3 研究现状概述17-22
- 1.3.1 针对分类的稀疏编码17-20
- 1.3.2 纹理特征描述20-22
- 1.4 本文的组织22-24
- 第二章 先备知识24-48
- 2.1 文中常用概念及符号说明24-26
- 2.2 稀疏编码及字典学习概述26-37
- 2.2.1 基于l_0范数的稀疏编码模型与算法26-28
- 2.2.2 基于l_1范数的稀疏表示模型与算法28-30
- 2.2.3 字典学习方法30-32
- 2.2.4 结构化稀疏编码模型与算法32-36
- 2.2.5 判别稀疏编码技术36-37
- 2.3 局部模式编码技术37-43
- 2.3.1 局部二值特征编码38-41
- 2.3.2 局部三值特征编码41-43
- 2.4 自相似性和分形几何学43-48
- 2.4.1 分形与自相似性43-45
- 2.4.2 间隙度分析45-48
- 第三章 视觉数据集及其应用说明48-61
- 3.1 稀疏编码实验相关的视觉数据集48-53
- 3.1.1 稀疏编码实验相关的人脸数据集48-49
- 3.1.2 稀疏编码实验相关的物体数据集49-50
- 3.1.3 稀疏编码实验相关的场景数据集50-52
- 3.1.4 稀疏编码实验相关的行为数据集52
- 3.1.5 用于识别实验比较的稀疏编码方法52-53
- 3.2 纹理数据集及其应用说明53-61
- 3.2.1 静态纹理数据集及其应用说明53-57
- 3.2.2 动态纹理数据集及其应用说明57-61
- 第四章 基于迭代重加权l_(2,1)最小化的结构化稀疏编码61-72
- 4.1 本章概述61-62
- 4.2 加权技术与结构化稀疏编码技术62-63
- 4.3 基于迭代重加权l_(2,1)范数最小化模型与算法63-67
- 4.3.1 基于迭代重加权l_(2,1)范数最小化模型RL21-SSC63-65
- 4.3.2 RL21-SSC模型求解65-67
- 4.3.3 RL21-SSC方法的分类策略67
- 4.4 实验对比和分析67-71
- 4.5 本章总结71-72
- 第五章 基于分类器集成的有监督稀疏编码72-88
- 5.1 本章概述72-73
- 5.2 经典有监督稀疏编码方法73-75
- 5.3 基于集成判别准则的有监督字典学习模型与算法75-80
- 5.3.1 基于集成判别准则的有监督字典学习模型EasyDL75-77
- 5.3.2 EasyDL模型求解77-80
- 5.3.3 EasyDL方法的分类策略80
- 5.4 实验对比与分析80-87
- 5.5 总结与结论87-88
- 第六章 基于层次组稀疏性的判别结构化稀疏编码88-99
- 6.1 本章概述88-90
- 6.2 基于层次组稀疏性的判别结构化稀疏编码模型与算法90-93
- 6.2.1 基于层次组稀疏性的判别结构化稀疏编码模型CHILD-DL90-91
- 6.2.2 CHILD-DL模型求解91-93
- 6.2.3 CHILD-DL方法的分类策略93
- 6.3 实验对比与分析93-98
- 6.4 总结与结论98-99
- 第七章 基于间隙度分析的纹理数据识别99-116
- 7.1 引言99-101
- 7.2 相关方法101-103
- 7.2.1 静态纹理描述101-102
- 7.2.2 动态纹理描述102-103
- 7.3 基于间隙度分析的静态纹理描述103-106
- 7.4 基于间隙度分析的动态纹理刻画106-109
- 7.4.1 动态纹理切片107
- 7.4.2 时空局部模式编码107-108
- 7.4.3 在二值编码图上的间隙度分析108-109
- 7.4.4 特征集成109
- 7.5 静态纹理分类实验对比与分析109-113
- 7.6 动态纹理分类实验对比与分析113-114
- 7.7 总结与结论114-116
- 总结与展望116-118
- 参考文献118-126
- 附录1 视觉数据识别实验上的稀疏编码方法比较126-127
- 附录2 攻读博士学位期间取得的研究成果127-128
- 致谢128-129
- 附件129
【共引文献】
中国期刊全文数据库 前10条
1 曾辉,江子瀛,喻红,许国雄;深圳市龙华地区快速城市化过程中的景观结构研究 Ⅲ农业用地结构及异质性分析[J];北京大学学报(自然科学版);2000年02期
2 赵婕;王庆飞;张铎毓;;用空隙法识别矿化强度[J];地质与勘探;2010年04期
3 刘嘉;王宏琦;;一种基于图割的交互式图像分割方法[J];电子与信息学报;2008年08期
4 孙显;付琨;王宏琦;;基于空间语义对象混合学习的复杂图像场景自动分类方法研究[J];电子与信息学报;2011年02期
5 郭俊理;常学礼;张安定;宋彦华;;科尔沁沙地植物多样性对生产力的影响及分布格局[J];干旱区地理;2006年04期
6 刘广海;王强;;基于基元自相关图的图像检索[J];广西师范大学学报(自然科学版);2009年03期
7 王晓明;冯鑫;党建武;;一种局部监督式纹理分类算法[J];兰州理工大学学报;2012年04期
8 吴承隆;肖龙;姜永栎;虞永方;;交通安全事件智能分析系统在大型桥梁的应用[J];电子科技;2013年01期
9 关兴良;胡仕林;蔺雪芹;鲁莎莎;;武汉城市群城镇用地扩展的动态模式及其驱动机制[J];长江流域资源与环境;2014年11期
10 张鸿杰;王宪;孙子文;;Shearlet多方向自适应加权融合的稀疏表征人脸识别[J];光电工程;2014年12期
中国重要会议论文全文数据库 前3条
1 谢世朋;胡茂林;;基于滤波器库的纹理自动分类的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
2 佟强;;图像区域粗糙分割情况下的区域物体分类[A];第四届全国几何设计与计算学术会议论文集[C];2009年
3 刘帅;孙浩;周石琳;;基于语义属性的遥感图像检索[A];第三届高分辨率对地观测学术年会优秀论文集[C];2014年
中国博士学位论文全文数据库 前10条
1 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
2 鹿瑞;自然图像的颜色恒常性计算研究[D];北京交通大学;2010年
3 白明;自主移动机器人的运动规划与图像理解研究[D];大连理工大学;2011年
4 陶e
本文编号:360034
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/360034.html