网络空间图像标注中半监督稀疏特征选择算法研究

发布时间:2020-11-01 19:33
   近年,随着计算机技术、存储技术、互联网技术以及多媒体信息技术的快速发展,以及数码产品的广泛使用,网络空间图像数据呈爆炸性增长。面对这些不断增加的网络空间图像数据,如何有效地对其进行浏览、检索和管理,成为当前多媒体内容理解和计算机视觉领域面临的一项亟待解决的研究问题。 自动图像标注(Automatice Image Annotation)技术,将关键词或者相关文档描述与图像联系起来,成为对大规模网络空间图像进行有效索引、检索、组织和管理的一个重要途径。然而,面对呈几何级数增长的网络空间图像数据,现有的自动图像标注技术面临着两个关键问题:一个是面对大规模网络空间图像,如何有效提高标注效率,另一个是如何利用大量的无标签图像来提升网络空间图像标注的准确度。 作为一种重要的手段,特征选择在网络空间图像标注中发挥着重要作用。近年,半监督稀疏特征选择成为特征选择技术中一个研究热点,它能够更好的提高网络空间图像标注的性能。本论文对现有半监督稀疏特征选择方法进行了深入研究,从稀疏表示理论、半监督学习方法以及多视图学习三个方面出发,提出了几种新的半监督稀疏特征选择算法,主要的研究成果及贡献包括: (1)提出了一种基于l2,1/2矩阵范数半监督稀疏特征选择算法 对新近提出的稀疏性惩罚l2,p(0p≤1)矩阵范数进行了深入研究,基于具有最好性能的稀疏性惩罚l2,1/2矩阵范数提出了一种新的半监督稀疏特征选择算法FSLG。l2,1/2矩阵范数不仅考虑了不同特征之间的关联,同时具有更好的稀疏性,使提取的特征更具判别性、更加稀疏,从而可以降低计算的复杂度,提高效率。本文给出了基于l2,1/2矩阵范数的半监督稀疏特征选择算法框架FSLG以及详细的求解方法。将所提半监督稀疏特征选择算法FSLG应用到了网络空间图像标注任务中,提高了网络空间图像标注的性能和效率。 (2)提出了一种基于Hessian正则化半监督稀疏特征选择算法 现有的半监督学习方法中最具代表性的工作是基于图拉普拉斯半监督学习方法,然而拉普拉斯正则化不具有很好的推断能力,无标签数据的几何结构信息没能被很好的利用。相对于拉普拉斯正则化,Hessian正则化可以使函数值随着测地距离线性变化,更好的保持局部流形结构,具有很好的推断能力,因此,基于Hessian正则化的半监督学习具有更好的学习性能。本文将Hessian正则化引入到半监督稀疏特征选择算法中,提出了基于Hessian正则化半监督稀疏特征选择算法HFSL,给出了算法的迭代求解方法,并将其应用到了网络空间图像标注任务,结果表明所提HFSL算法能够很好的提高网络空间图像标注的性能。 (3)提出了两种基于多视图学习的半监督稀疏特征选择算法 目前大多数特征选择方法都是针对单一视图(Single-view)数据的,当其面对多视图(Multi-view)数据时,一般是将多视图数据简单地串接为一个长的特征向量进行处理。然而,这种直接串接的方法不能充分利用多视图之间的互补和一致性信息,同时忽略了不同视图的物理解释。近年,多视图学习(Multi-view Learning)得到了广泛关注及研究,多视图学习可以很好的利用不同视图之间的互补属性和一致性。基于不同视图之间的互补属性,论文提出了多视图Hessian半监督稀疏特征选择算法MHSFS,基于一致性提出了基于l2,1/2矩阵范数和共享子空间的半监督稀疏特征选择算法SFSLS,并分别给出了两种算法的详细求解过程。将所提基于多视图学习的半监督稀疏特征选择算法应用到了网络空间图像标注任务,结果表明所提算法优于现有的半监督稀疏特征选择算法,能够提高网络空间图像标注的性能。
【学位单位】:北京交通大学
【学位级别】:博士
【学位年份】:2015
【中图分类】:TP391.41
【部分图文】:

框架图,框架,学习器,非一致性


协同训练Co-training [115]算法就是采用后期结合方式进行多视图学习的。协同训练框架如图2-2所示,通常是在每一个视图上训练相互独立又彼此关联的两个学习器。在一致性准则下,尽量在每一次迭代过程中使两个学习器的一致性达到最大。当然,两个学习器的预测值之间也可能存在非一致性,然而,这个非一致性可以被传播回训练集,从而帮助获得更加准确的学习器,因此,在下一个迭代过程中使非一致性达到最小。r 、train predict \ ■viewll ?? ???,Hypothesis 1 画^ | ? ?? ?I ? I ^■,. .■> I ? # ? II labeled data exchange [validation data .I 丄 + t ( ) I Iview2 丨丨 IZa4 Hypothesis 2 ■■岭 | 十( I train predict、 I图2-2协同训练框架Figure 2-2 Co-training framework.(2)中期方式中期结合方式是指在训练分类器期间将不同的视图结合起来。多核学习算法就是釆用中期结合方式进行多视图学习的,它是在每一个视图上分别计算独立的核

框图,多核,框图,核结合


上分别计算独立的核,然后通过一个基于核的方法将多个核结合起来。多核学习框图如图2-3所示,该方式中不是采用单一一个核函数,而是通过一个算法来选用一组合适的核以及核结合方式进行多视图学习。对于多个核之间的结合方式有几种形式,每一种形式都有其独有的结合参数特性,这些结合方式大概可以分为以下两类:线性结合方式和非线性结合方式。线性结合方式一般采用直接相加核和加权相加核将多个核结合到一起。M直接相加核:KOCi,X) = IKiJ^X,,X) (2-22)走寘1M权重相加核:= (2-23)*=1直接相加核对所有核的依赖相同,但是这是不现实的,而采用权重相加核则具有更好的效果。27

框图,子空间,框图,视图


View M、0 ? ? ? 1J图2-3多核学习框图Figure 2-3 Multiple kernel learning framework.对不同的核采用线性结合具有很大的局限性,因此可以采用其他非线性的方式将多个核结合起来,例如指数幂方式或者能量方式:指数幂方式 KOc丨’ Xj) = exp(-Xd乂 AXj) (2-24)M能量方式 A,xJ (2-25)(3)前期结合方式前期结合方式是指首先将多个视图直接结合到一起,然后再进行分类器训练。基于子空间学习的方法就是釆用前期结合方式进行多视图学习的,它首先将多个视图直接结合到一起,然后利用潜在子空间进行学习。子空间学习框图如图2-4所示,该方式是寻求多个视图共享的一个潜在子空间。典型相关分析(CCA)[116]已经成为对多视图数据进行子空间学习的一个基本工具。通过最大化子空间中的两个视图之间的关联,CCA在每一个视图上完成一个最优映射。然而
【参考文献】

相关期刊论文 前3条

1 ;L_(1/2) regularization[J];Science China(Information Sciences);2010年06期

2 赵谦;孟德宇;徐宗本;;L_(1/2)正则化Logistic回归[J];模式识别与人工智能;2012年05期

3 袁莹;邵健;吴飞;庄越挺;;结合组稀疏效应和多核学习的图像标注[J];软件学报;2012年09期


相关博士学位论文 前2条

1 王娇;多视图的半监督学习研究[D];北京交通大学;2010年

2 钱强;复杂场景下的多视图学习方法研究[D];南京航空航天大学;2013年



本文编号:2865989

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2865989.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d759e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com