多视图自适应半监督特征选择算法研究
发布时间:2021-04-08 05:57
近年来,随着拍照设备的普及和互联网技术的飞速发展,网络中每天产生数以亿计的图像信息并且传播迅速。海量的图像所包含的信息冗杂,格式不一,不仅耗费了大量的网络资源,而且难以有效的进行搜索和管理。因此,如何对网络中的图像进行高效的管理,是图像处理和计算机视觉领域中的一个研究热点,也是实际应用中急需解决的问题。在图像处理和计算机视觉等领域中,图像往往是由高维特征向量表示。高维数据不仅提高了处理数据的时间和空间要求,甚至有时候会产生“维度灾难”问题,使得数据难以处理。因此特征选择技术,尤其是半监督特征选择在过去十几年得到了广泛的研究。其中,基于图拉普拉斯的半监督特征选择方法凭借其良好的标签传播能力和计算成本低等优点,在图像处理和识别等领域中得到广泛应用。虽然基于图拉普拉斯的半监督特征选择算法在实际应用中获得了不错的性能,但是它们仍然存在局限性。首先,这些现有算法的性能严重依赖于所构建的拉普拉斯权重图的质量,而且权重图一旦构建就无法更改。其次,当面对图像的多视图特征向量时,这些现有算法一般是直接将多个视图的特征向量串联成一个长向量来处理,忽略了多视图之间包含的互补信息。为了克服以上缺陷,将自步学习...
【文章来源】:华北理工大学河北省
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
图像的多视图高维特征向量Fig.1Multi-viewfeaturevectorofimages
第1章绪论-9-步学习方法,使得在分类任务中,按照由简单样本到复杂样本的顺序进行学习[25]。分类器的损失函数定义为预测标签与真实标签之间的损失,样本重要性则根据流形的光滑性来度量,然后利用新的损失函数自适应地计算了伪标记样本和未标记样本的重要性,将置信度高的预测标签作为未标记样本伪标记。Xu等人将SPL和多视图学习融合到聚类算法框架中,提出了一个多视图自步学习算法(Multi-viewSelf-PacedLearning,MSPL)框架[26]。一方面,MSPL通过引入SPL,克服了优化目标函数时,易于陷入局部极小值的缺陷。另一方面,通过将SPL与多视图相结合,使得在学习过程中不但考虑了样本层次的复杂性,而且考虑了视图层次的复杂性。1.3研究内容本文深入研究了特征选择、半监督学习、多视图学习以及自步学习等理论,然后针对当前基于图拉普拉斯的半监督特征选择中存在的缺陷,提出了新的多视图自适应半监督特征选择算法,并将其应用到图像标注任务中,如图2所示。利用自步学习思想使所提算法可以根据当前的预测标记的反馈信息自适应更新拉普拉斯权重图,更新后的权重图可以更精确的表示训练样本的流形结构,进而可以选取更稀疏、更具判别性的特征,提升图像标注的准确率和效率。此外,通过引入多视图学习,充分利用多个视图的信息,进一步提升了图像标注的准确率。图2研究内容Fig.2Theresearchcontent
第2章相关理论介绍-25-式中:f—自步函数;—编码预定课程信息的可行域。SPCL与课程学习中的“教师驱动”和自步学习中的“学生驱动”都不同,它可以同时利用训练之前的先验知识以及训练期间学习器的反馈信息。因此该机制该类似于人类学习过程中的“教师-学生-协作”学习模式。2.4多视图学习随着采集设备和采集技术的发展,可以轻易获取多视图数据,这些数据描述了同一个对象的不同属性。例如,一幅图像可以从颜色相关图、颜色矩和边缘方向直方图等多个视图中进行描述。它们之间往往蕴含着丰富的相关和互补信息,为了充分利用这些信息,学者们对多视图学习进行了广泛的研究,并且提出了多种多视图学习算法。目前,这些算法分为四类[39]:协同训练、子空间学习、多核学习和基于图的多视图学习。2.4.1协同训练Blum和Mitchell于上世纪末提出协同训练算法,该算法本质上是SSL中自训练算的一种扩展[40]。自训练通过将当前分类器中置信度高的样本作为有标签样本加入训练过程,实现了自己训练自己的目的;协同训练则是首先在两个视图中分别利用它们各自视图中的标签数据训练一个分类器,然后用分类器预测该视图中的未标记数据,在所得到的预测标签中取置信度最高的前k个预测标签作为有标签数据加入到另一个视图中进行训练,在两个视图中交替迭代,以此类推,直到两个视图中的未标记数据的个数为0,具体流程如图4所示。图4协同训练流程Fig.4Generalprocedureofco-training
【参考文献】:
期刊论文
[1]基于多视图半监督学习的人体行为识别[J]. 唐超,王文剑,王晓峰,张琛,邹乐. 模式识别与人工智能. 2019(04)
[2]基于聚类假设的数据流分类算法[J]. 李南. 模式识别与人工智能. 2017(01)
[3]基于颜色矩的图像检索算法研究[J]. 张少博,全书海,石英,杨阳,李云路,程姝. 计算机工程. 2014(06)
[4]多标记学习的嵌入式特征选择[J]. 葛雷,李国正,尤鸣宇. 南京大学学报(自然科学版). 2009(05)
[5]流形学习方法中的若干问题分析[J]. 高小方. 计算机科学. 2009(04)
[6]普通话语音情感识别的特征选择技术[J]. 谢波,陈岭,陈根才,陈纯. 浙江大学学报(工学版). 2007(11)
[7]几种边界特征描述方法的比较研究[J]. 曹茂永,孙农亮,郁道银. 光学技术. 2003(03)
博士论文
[1]多视图特征学习方法研究[D]. 吴飞.南京邮电大学 2016
[2]网络空间图像标注中半监督稀疏特征选择算法研究[D]. 史彩娟.北京交通大学 2015
[3]小波理论在图像去噪与纹理分析中的应用研究[D]. 褚标.合肥工业大学 2008
硕士论文
[1]基于低秩理论的多重集典型相关分析的研究与应用[D]. 倪怀发.南京理工大学 2017
[2]多标签特征选择算法研究及应用[D]. 印晶.南京师范大学 2016
[3]过滤式特征选择算法研究[D]. 许尧.合肥工业大学 2015
[4]文本分类特征选择与分类算法的改进[D]. 郑俊飞.西安电子科技大学 2012
本文编号:3124987
【文章来源】:华北理工大学河北省
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
图像的多视图高维特征向量Fig.1Multi-viewfeaturevectorofimages
第1章绪论-9-步学习方法,使得在分类任务中,按照由简单样本到复杂样本的顺序进行学习[25]。分类器的损失函数定义为预测标签与真实标签之间的损失,样本重要性则根据流形的光滑性来度量,然后利用新的损失函数自适应地计算了伪标记样本和未标记样本的重要性,将置信度高的预测标签作为未标记样本伪标记。Xu等人将SPL和多视图学习融合到聚类算法框架中,提出了一个多视图自步学习算法(Multi-viewSelf-PacedLearning,MSPL)框架[26]。一方面,MSPL通过引入SPL,克服了优化目标函数时,易于陷入局部极小值的缺陷。另一方面,通过将SPL与多视图相结合,使得在学习过程中不但考虑了样本层次的复杂性,而且考虑了视图层次的复杂性。1.3研究内容本文深入研究了特征选择、半监督学习、多视图学习以及自步学习等理论,然后针对当前基于图拉普拉斯的半监督特征选择中存在的缺陷,提出了新的多视图自适应半监督特征选择算法,并将其应用到图像标注任务中,如图2所示。利用自步学习思想使所提算法可以根据当前的预测标记的反馈信息自适应更新拉普拉斯权重图,更新后的权重图可以更精确的表示训练样本的流形结构,进而可以选取更稀疏、更具判别性的特征,提升图像标注的准确率和效率。此外,通过引入多视图学习,充分利用多个视图的信息,进一步提升了图像标注的准确率。图2研究内容Fig.2Theresearchcontent
第2章相关理论介绍-25-式中:f—自步函数;—编码预定课程信息的可行域。SPCL与课程学习中的“教师驱动”和自步学习中的“学生驱动”都不同,它可以同时利用训练之前的先验知识以及训练期间学习器的反馈信息。因此该机制该类似于人类学习过程中的“教师-学生-协作”学习模式。2.4多视图学习随着采集设备和采集技术的发展,可以轻易获取多视图数据,这些数据描述了同一个对象的不同属性。例如,一幅图像可以从颜色相关图、颜色矩和边缘方向直方图等多个视图中进行描述。它们之间往往蕴含着丰富的相关和互补信息,为了充分利用这些信息,学者们对多视图学习进行了广泛的研究,并且提出了多种多视图学习算法。目前,这些算法分为四类[39]:协同训练、子空间学习、多核学习和基于图的多视图学习。2.4.1协同训练Blum和Mitchell于上世纪末提出协同训练算法,该算法本质上是SSL中自训练算的一种扩展[40]。自训练通过将当前分类器中置信度高的样本作为有标签样本加入训练过程,实现了自己训练自己的目的;协同训练则是首先在两个视图中分别利用它们各自视图中的标签数据训练一个分类器,然后用分类器预测该视图中的未标记数据,在所得到的预测标签中取置信度最高的前k个预测标签作为有标签数据加入到另一个视图中进行训练,在两个视图中交替迭代,以此类推,直到两个视图中的未标记数据的个数为0,具体流程如图4所示。图4协同训练流程Fig.4Generalprocedureofco-training
【参考文献】:
期刊论文
[1]基于多视图半监督学习的人体行为识别[J]. 唐超,王文剑,王晓峰,张琛,邹乐. 模式识别与人工智能. 2019(04)
[2]基于聚类假设的数据流分类算法[J]. 李南. 模式识别与人工智能. 2017(01)
[3]基于颜色矩的图像检索算法研究[J]. 张少博,全书海,石英,杨阳,李云路,程姝. 计算机工程. 2014(06)
[4]多标记学习的嵌入式特征选择[J]. 葛雷,李国正,尤鸣宇. 南京大学学报(自然科学版). 2009(05)
[5]流形学习方法中的若干问题分析[J]. 高小方. 计算机科学. 2009(04)
[6]普通话语音情感识别的特征选择技术[J]. 谢波,陈岭,陈根才,陈纯. 浙江大学学报(工学版). 2007(11)
[7]几种边界特征描述方法的比较研究[J]. 曹茂永,孙农亮,郁道银. 光学技术. 2003(03)
博士论文
[1]多视图特征学习方法研究[D]. 吴飞.南京邮电大学 2016
[2]网络空间图像标注中半监督稀疏特征选择算法研究[D]. 史彩娟.北京交通大学 2015
[3]小波理论在图像去噪与纹理分析中的应用研究[D]. 褚标.合肥工业大学 2008
硕士论文
[1]基于低秩理论的多重集典型相关分析的研究与应用[D]. 倪怀发.南京理工大学 2017
[2]多标签特征选择算法研究及应用[D]. 印晶.南京师范大学 2016
[3]过滤式特征选择算法研究[D]. 许尧.合肥工业大学 2015
[4]文本分类特征选择与分类算法的改进[D]. 郑俊飞.西安电子科技大学 2012
本文编号:3124987
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3124987.html
最近更新
教材专著