基于带约束矩阵的图像表示与检索算法研究

发布时间:2018-02-05 20:39

  本文关键词: 低秩矩阵 矩阵分解 矩阵恢复 图像表示 跨媒体检索 出处:《浙江大学》2016年博士论文 论文类型:学位论文


【摘要】:随着智能手机的发展,以及以微信为代表的移动社交应用的普及,移动互联网中图像的数据量正呈指数型增长。不仅图像的数据量在增加,其清晰度也随着采集设备的发展被不断提高。高清图像给用户带来更直观、更生动、更细腻体验的同时,也意味着相关学习算法需要处理的特征维度更高。高维特征不仅带来了存储和计算等方面的代价,更对传统算法提出了严峻的挑战,如“维度灾难”。此外,图像管理技术如图像检索(尤其是跨媒体图像检索)的重要性也随着海量图像数据的出现而凸显。本文围绕图像应用领域的基础问题——图像表示和热点问题——跨媒体图像检索,展开深入的研究。图像表示是指将图像表示成特征空间中的特征向量,用作后续算法(如:图像聚类、图像识别、图像检索等)的输入的过程。有效的图像表示方法不仅能降低数据存储,传输和学习成本,更能刻画图像的潜在几何结构和发掘其语义信息从而提升学习效果。考虑到图像数据集一般都可以以低秩矩阵的形式表示,本文从近年来非常流行的非负矩阵分解算法出发,针对经典非负矩阵分解算法在用于后续学习时的稳定性上的不足和其在保持数据的局部性和稀疏性上的缺陷,提出了带约束的非负矩阵分解算法。图像检索,尤其是跨媒体图像检索(如使用文本检索图像)对海量图像数据管理至关重要。跨媒体图像检索的核心问题是不同特征空间的向量之间相似度的计算问题。现有的跨媒体图像检索算法基本是围绕着如何将不同特征空间中的数据映射到相同公共子空间这一研究问题而展开。在这一框架下,上文中的单模态图像表示算法难以被有效利用。基于带约束的低秩矩阵恢复,本文提出了一种全新的跨媒体图像检索算法。该算法可以充分利用单一媒体上学习得到的低维图像表示和不同媒体间数据的关系,来同时保持数据的全局和局部一致性。具体来说,本文的主要工作概括如下:1.稀疏编码仅仅是传统非负矩阵分解中的一个附带功能,在大多数情况下非负矩阵分解并不能得到较好的稀疏表达,以致将这类低维表示用于其他学习任务(如分类,聚类等)时并不能获得最优的性能。针对这一问题,我们改进了非负矩阵分解的进化算法一一概念分解算法,提出了基于局部坐标约束的概念分解算法(Locality-Constrained Concept Factorization, LCF)。 LCF在原始概念矩阵分解模型中引入了基于局部坐标编码约束的正则项,该正则项通过约束概念(即基向量)尽量靠近数据点来达到每个数据点可以被表示为更少的基向量的线性组合的目的,即稀疏编码的目的。我们使用和原始NMF类似的乘法更新规则对此问题求解。基于真实数据的聚类实验表明:此方法学习到的低维表示可以同时具备稀疏性和局部性,具有更强的表示能力。2.目前非负矩阵分解的改进工作都是针对非负矩阵分解这一过程本身,而很少考虑学习得到的低维表示的后续使用。我们考虑当非负矩阵分解得到的低维表示用于统计分析,如线性回归时的情况。从增强后续线性回归模型的稳定性和减小其预测误差的角度出发,我们使用了最优化实验设计的方法对非负矩阵分解的低维表示进行了约束。另外,针对NMF无法保持数据的潜在流形结果的缺点。我们进一步引入了Hessian正则约束,相比于常见的拉普拉斯正则约束,它具有更好的泛化能力。最终,我们提出了一种基于A优化和Hessian正则的非负投影算法(A-Optimal Non-negative Projection with Hessian regularization, AHNP)。AHNP不仅仅能学到基于局部且保持流行结构的低维表示。最重要的是,此表示后续用于回归分析时,学习到的回归模型具有更好的稳定性,更低的预测误差。为了求解最终的优化问题,我们提出了基于乘法更新的优化算法。3.考虑到传统图像表示算法学习得到的低维表示适用于图像分类,图像聚类,目标检测,图像检索等诸多领域,而无法直接用于跨媒体检索。我们针对跨媒体检索提出了一种全新的基于低秩矩阵恢复的半监督学习算法——基于低秩矩阵恢复的跨媒体成对约束传播算法(Matrix Completion for Cross-view Pairwise Constraint Propagation, MCPCP)。 MCPCP将跨媒体检索看作关联矩阵补全问题,矩阵中的元素表示对应的图像和文本的相关程度。MCPCP使用单模态的图像(文本)表示算法学习得到的特征表示来构造单模态上的近邻图,并基于此近邻图引入流形正则达到保持数据在单模态上的局部一致性的目的。另外,通过约束关联矩阵为低秩矩阵,MCPCP同时保持了图像和文本数据的全局一致性。为了高效求解最终的优化问题,我们使用了易于并行化的ADMM算法。
[Abstract]:......
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP391.41

【参考文献】

相关期刊论文 前3条

1 毕达天;邱长波;张晗;;数据降维技术研究现状及其进展[J];情报理论与实践;2013年02期

2 胡涛;武港山;任桐炜;吉亮;;基于Ontology的跨媒体检索技术[J];计算机工程;2009年08期

3 张鸿;吴飞;庄越挺;陈建勋;;一种基于内容相关性的跨媒体检索方法[J];计算机学报;2008年05期

相关博士学位论文 前3条

1 肖延辉;基于矩阵分解的图像表示理论及其应用研究[D];北京交通大学;2014年

2 胡俐蕊;非负矩阵分解方法及其在选票图像识别中的应用[D];安徽大学;2013年

3 尚丽;稀疏编码算法及其应用研究[D];中国科学技术大学;2006年



本文编号:1492723

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1492723.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户80601***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com