当前位置:主页 > 科技论文 > 软件论文 >

多特征融合的场景分类方法研究

发布时间:2019-08-24 15:54
【摘要】:由于多媒体技术和互联网网络技术的快速发展,产生大量数字图像。依靠传统人工方法进行分类,及其繁琐且耗时。针对这一现象,智能图像分类成为一个研究热点。目前,研究人员已经提出很多图像场景分类算法。由于图像中包含的各种物体信息非常丰富,彼此之间的空间分布错综复杂,基于单一特征的描述方法不能完全描述图像的信息。针对单一特征描述的不足,本文提出了基于多特征融合的图像场景分类算法。本文首先分析了图像场景分类的研究背景、国内外研究现状及相关应用。接着介绍了本文用到的模型和技术,包括概率潜在语义分析(PLSA)、局部约束线性编码(LLC)和支持向量机(SVM)的工作原理。接着在已有的模型和算法上加入多种底层融合特征,进行场景分类实验,并对结果进行分析和对比。主要研究内容如下:一方面,提出了一种基于PLSA的多特征融合图像场景分类方法。该方法分别提取图像的LBP特征和SIFT特征,两者组合起来描述图像场景能够提供更丰富的信息,特征之间能够达到优势互补。将两种特征使用词袋模型进行量化,生成对应特征的词袋表示。然后将两种特征的词袋表示直接连接,得到图像的词袋表示。再将图像的词袋表示结合PLSA模型来学习,得到图像集的视觉主题分布和潜在主题分布。最后将图像的潜在主题分布结合SVM分类器进行分类判别,得到最终的实验结果。实验部分,首先最优化PLSA模型的参数,然后将该算法与单一特征场景分类算法以及其它场景分类算法做对比,实验结果表明该算法提高了分类准确率,验证了基于PLSA模型的多特征融合框架的可行性。另一方面,提出一种基于稀疏编码的多特征融合场景分类方法,有效缓解了单一特征在描述图像特征时的局限性。该方法首先分别提取图像的GIST特征、SIFT特征和PHOG特征,然后使用局部约束线性编码的方法对SIFT特征进行稀疏编码,得到SIFT特征的稀疏向量表示。接着将SIFT特征稀疏向量表示、GIST特征和PHOG特征进行串联融合,得到图像的特征表示。然后将图像的特征向量表示结合多类线性SVM分类器进行分类,得到最后的分类结果。实验结果表明,该方法与其他分类框架进行对比,具有较好的分类性能。验证了特征融合分类模型的有效性与稳定性。
【图文】:

模型参数,模型图


(b)邋PLSA概率分布的矩阵分解图逡逑图2.1邋PLSA模型图逡逑2.1.2模型参数逡逑利用PLSA模型来发现文本当中的主题。类似的,在场景分类中,PLSA将一幅图像类逡逑比成文档来发现图像所属的类别,即主题。图像中的基本信息便通过视觉词来描述,并把逡逑图像的语义作为潜在的主题。假设数据集为D邋=邋{02,...,^},视觉阶二{Wl,w2,...,wM},逡逑共现词表NB邋=邋;7(',心为图像和视觉单词共同形成,NB邋=邋?(wy,rf,)表示单词w,出现在图像逡逑彳中的频次,该模型将每一个观察值和隐含变量2邋62邋=邋|21,22,...,24丨关联起来。尸(^;)表示逡逑观测到图像邋<邋的概率,表示在隐含变量4条件下视觉单词出现的概率,即各个逡逑主题的特征。表示在隐变量空间中图像式的概率分布,仅表示某个特定文档的主逡逑题分布,不能给未知图像带来任何的先验知识。PLSA模型参数是两个条件概率分尸丨wjz;)和尸&|00,它们都满足多项分布,可以用EM算法计算得到。逡逑2.1.3参数估计算法逡逑

线性可分


六十年代初,,Vapnik[1G]领导的AT&TBel】实验室提出了一是一种有监督的分类技术,一开始应用于模式识别领域。年代,SVM才得到迅速发展和有效改进。通俗来讲,SVM种对线性和非线性数据进行分类的方法。SVM是一种算的训练样本投射到高维空间上,通过核技巧方法在高维空M是一种有效的数据挖掘工具,可以用于对象识别、手写预测验证等领域。通常SVM可以分为线性和非线性。逡逑名思义就是可以找到一个超平面,它将待分类的两种样本区分后离该平面尽可能远,图2.2为线性可分示例图,类B则在所划平面的左下方。逡逑个逡逑
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41

【参考文献】

相关期刊论文 前10条

1 严考碧;李志欣;张灿龙;;基于主题模型的多示例多标记学习方法[J];计算机应用;2015年08期

2 许庆勇;江顺亮;黄伟;李菁;徐少平;叶发茂;;基于多特征融合的深度置信网络图像分类算法[J];计算机工程;2015年11期

3 ZHOU Li;HU DeWen;ZHOU ZongTan;;Scene recognition combining structural and textural features[J];Science China(Information Sciences);2013年07期

4 杨昭;高隽;谢昭;吴克伟;;局部Gist特征匹配核的场景分类[J];中国图象图形学报;2013年03期

5 卜莎莎;章毓晋;;基于局部约束线性编码的单帧和多帧图像超分辨率重建[J];吉林大学学报(工学版);2013年S1期

6 范玉华;秦世引;;基于潜在语义分析的场景分类优化决策方法[J];计算机辅助设计与图形学学报;2013年02期

7 袁杰;魏宝刚;王李冬;;一种综合PHOG形状和小波金字塔能量分布特征的图像检索方法[J];电子学报;2011年09期

8 闫伟红;赵海峰;罗斌;;基于LBP特征的人脸图像识别[J];计算机工程与应用;2011年18期

9 李志欣;施智平;李志清;史忠植;;融合语义主题的图像自动标注[J];软件学报;2011年04期

10 贾世杰;孔祥维;付海燕;金光;;基于互补特征和类描述的商品图像自动分类[J];电子与信息学报;2010年10期

相关博士学位论文 前1条

1 解文杰;基于中层语义表示的图像场景分类研究[D];北京交通大学;2011年

相关硕士学位论文 前6条

1 刘静;基于特征组合的图像场景分类[D];湘潭大学;2015年

2 郭佳;场景图像分类的相关技术研究[D];西安电子科技大学;2013年

3 陈健斌;图像特征提取及其相似度的研究和实现[D];西安电子科技大学;2012年

4 王同刚;基于中层语义的图像场景分类算法研究[D];北京交通大学;2011年

5 王玲;基于LBP的特征提取研究[D];北京交通大学;2009年

6 孙滔;基于颜色空间的图像特征提取的研究[D];吉林大学;2006年



本文编号:2529059

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2529059.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户23cbb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com