场景分类中上下文特征描述模型的研究

发布时间：2021-12-18 12:14

　　在互联网飞速发展的今天,网络在给人们提供丰富信息资源的同时,也给海量图像数据的整理和归类带来了空前的难度。为此,各种图像分类技术应运而生,其中场景图像分类是该研究领域的一个重要分支。场景图像分类是通过计算机将表达场景属性的各种信息转化为具体的特征描述,并构建合适的特征表达模型,进而实现场景图像的自动标注和分类,广泛地应用在图像分析、整理、视频摘要及机器人导航等机器视觉应用领域中。场景图像是多个复杂信息的载体,其中变化多样的繁杂目标物之间,以及目标物与环境之间存在着复杂的隐含关系,反映了许多重要的语义联系,即上下文关系,这些关系往往较为隐蔽且多变,难以描述。可用于场景分类的图像特征大致分为低层视觉特征、中层语义特征、高层语义特征以及深度学习特征几大类。如何从这几类特征中获取可以充分表达场景语义的上下文关系,是提升场景分类准确率的关键因素之一。本文针对场景分类中存在的难点问题,紧密围绕场景图像的上下文关系,构建了合理有效的上下文特征描述模型,显著提升了场景分类算法的精度。本文主要工作和创新点如下:（1）场景的时频上下文特征描述模型的构建。针对仅利用空间时域特征,无法充分构建复杂的视觉字典,...

【文章来源】：西安理工大学陕西省

【文章页数】：131 页

【学位级别】：博士

【部分图文】：

场景分类中上下文特征描述模型的研究

场景分类部分图像

统计图,检索引擎,统计图,场景图

景所反映的整体内容进行分析和认知，从而获得场景图像的标注。虽然人类能够迅速并且准确地判断场景的类别，但是对于计算机来说，由于场景图像的丰富性、模糊性和各种光照尺度的变化，实现场景图像的自动标注和分类仍然是一件具有挑战性的工作。影响场景图像分类性能的重要因素是如何在图像与类别之间建立一种合理且具有区分力的表达，这种表达不但可以获得场景图像的结构属性，而且能够抑制那些不明显的细节差异。在过去的几十年中，国内外研究者对于场景图像的分类都进行了大量地研究和探索，产生了许多研究文献和方法，图1-2统计了二十世纪末至今关于场景分类方向的文献数量（利用标题精确检索）。从图中可以看出，在2000年之前，受限于计算机软硬件的发展，对于大计算量的场景图像分类研究发表论文数不多。1990年之前，共检索到9篇相关论文，1991年至2000年检索到的相关论文数累计75篇。自2000年之后，场景分类的文章数量逐年上升，特别是2011年至今增幅显著，检索到的相关论文数累计达2427篇，由此可以看出，人工智能技术的发展带动了场景分类研究的深入。图1-2不同检索引擎中场景分类文章数量统计图Fig.1-2Quantitativestatisticsofsceneclassificationarticlesindifferentsearchengines如图1-3所示，统计了自2011年起至今的近年来场景分类相关文章，以及在部分国际知名期刊和会议的发表情况，可以看出，随着人工智能技术在诸多领域应用的需求，场景分类的研究也受到了持续地关注。统计自2016年至今三年多时间内，场景分类相关文章的研究方法，如图1-4所示。随着深度学习研究的迅速发展，利用低层和中层特征的分类算法已逐渐退出研究的主流方向，逐渐被高层语义和深度学习算法所取代，得力于深度学习领域研究的飞速发展，利用

统计图,统计图,和会,期刊

第1章绪论5深度学习算法进行场景分类研究的文献数量逐年增多，在2018年已超过160篇，2019年至今已达114篇之多，可见其数量仍呈上升趋势。图1-3国际知名期刊和会议中场景分类相关文章数量统计图Fig.1-3Quantitativestatisticsofarticlesrelatedtosceneclassificationininternationallyrenownedjournalsandconferences图1-4近几年场景分类相关文章研究方法的数量统计图Fig.1-4Quantitativestatisticsofresearchmethodsrelatedtosceneclassificationarticlesinrecentyears究其原因，是因为深度学习算法能够提出具有较强泛化性的内涵共性特征，这一特征很大程度上解决了拍摄角度不同、场景具有一定复杂环境的问题。而低层和中层语义特征

【参考文献】：
期刊论文
[1]基于显著性区域检测和水平集的图像快速分割算法[J]. 叶锋,李婉茹,陈家祯,郑子华.  电子与信息学报. 2017(11)
[2]基于视觉敏感区域信息增强的室内场景分类算法[J]. 史静,朱虹,王婧,薛杉.  模式识别与人工智能. 2017(06)
[3]兼顾特征级和决策级融合的场景分类[J]. 何刚,霍宏,方涛.  计算机应用. 2016(05)
[4]迁移近邻传播聚类算法[J]. 杭文龙,蒋亦樟,刘解放,王士同.  软件学报. 2016(11)
[5]基于Sigmoid函数拟合的多曝光图像直接融合算法[J]. 付争方,朱虹,薛杉,余顺园,史静.  仪器仪表学报. 2015(10)
[6]基于马尔科夫随机场的纹理图像分割方法研究[J]. 曹家梓,宋爱国.  仪器仪表学报. 2015(04)
[7]基于多尺度上下文语义信息的图像场景分类算法[J]. 张瑞杰,李弼程,魏福山.  电子学报. 2014(04)
[8]第33次中国互联网络发展状况统计报告[J]. 张紫.  计算机与网络. 2014(02)
[9]利用编码层特征组合进行场景分类[J]. 崔崟,段菲,章毓晋.  吉林大学学报(工学版). 2013(S1)
[10]基于潜在语义分析的场景分类优化决策方法[J]. 范玉华,秦世引.  计算机辅助设计与图形学学报. 2013(02)

本文编号：3542371

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3542371.html

上一篇：基于智能零售终端设备的交互设计研究
下一篇：基于视觉的多尺度低空小型无人机检测系统

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|