超复数DCT变换域下的场景分类算法研究

发布时间:2021-01-24 18:30
  随着计算机及多媒体设备的普及,每天都会有海量的数字图像产生、发布和共享,这给人们的生活提供极大便利的同时也对人们迅速地从浩如烟海的图像数据中寻找到自己所需要的信息带来了挑战。如何有效地分析、组织和管理图像数据,实现基于内容的场景分类已成为图像处理领域的研究热点。研究的难点在于如何使计算机能够从人类的认知角度理解场景图像的语义信息。为了提高场景分类的速度和准确率,结合DCT纹理特性以及超复数彩色空间并行性,本文先对DCT变换进行了研究,在提出三种DCT变换域下的场景分类算法的基础上,最终引入超复数提出了一种超复数DCT变换域下的场景分类算法。本文的主要研究内容包括*:(1)针对现有场景分类算法都是在非压缩域实现并且分类速度慢的问题,提出了一种DCT变换域的快速场景分类算法。DCT变换后频域系数具有能量集中性和多尺度多分辨率特征,该特征能够很好地反映图像纹理特征并且易于量化分析,若选择合适的变换块大小,DCT变换还具有较好的快速性。本文根据这些特征对场景图像进行DCT变换后提取频域系数进行分类实验,实验结果表明该算法很好地提高了场景分类的速度。(2)为了进一步提高场景分类准确率,根据谱残差... 

【文章来源】:兰州理工大学甘肃省

【文章页数】:78 页

【学位级别】:硕士

【部分图文】:

超复数DCT变换域下的场景分类算法研究


场景分类示意图

变化图,场景图,场景,分类方法


(c)观察尺度变化 (d)光照变化图 1.2 不同条件下的场景图像 最近几年,国内外的很多高校和科研单位都对场景分类进行了深入地研究。国外,有麻省理工学院、斯坦福大学、牛津大学和卡内基梅隆大学等;国内主要中科院、清华大学和南京大学等。计算机视觉领域的一些顶级期刊,如 PAMI,IJCV,CVIU 及 PR 等发表了很多场景分类的成果;ICCV,CVPR 及 ICCV 等著名的计算机视觉领域的国际会议也相继出版了大量很有价值的研究成果。根据获取图像内容信息的方式不同,可以将现有的场景分类方法分为三类:(1) 基于图像底层特征与中高层词汇建模的方法;(2) 基于图像局部与全局建模的方法;(3) 基于图像空域与频域建模的方法。1.2.1 基于图像底层特征与中高层词汇建模的场景分类方法目前多数场景分类方法主要集中在人类视觉感知的基本层次,根据在图像场景特征提取过程中是否构建了图像特征与场景对象之间的映射关系可以把现有的场景分类方法分成以下两类:(1) 基于底层特征的分类方法

示意图,特征描述,分类方法,单位


主要分为目标视觉词汇表达法和局部词汇概念法。目标视觉词汇表达法对场景的描述主要通过识别场景中包含的一些目标,通常需要对图像进行分割后获取一些有代表性的区域(如天空、人、汽车、草地、建筑物等),利用分类器对这些局部区域分类后进行标记,然后通过定义后的局部信息完成对整幅场景图像的分类。Fan[9]使用场景图像中一些比较常见的显著性目标对图像进行分类;Fredembach[10]和 Carson[11]对图像进行不同区域的分割,通过判断分割出区域的类别及不同区域间的布局关系来得到场景类别。局部词汇概念法通过检测图像局部描述子获取图像中层属性表示图像类别,该方法不需要对图像分割,通过局部描述子表示图像内容信息。局部语义概念法最具代表性的就是 BoW(Bag-of-Words)[12-14],根据视觉词汇的直方图匹配进行场景分类。值得注意的是,许多研究者在 BoW 基础上用概率生成模型来进行建模,通过概率生成模型将图像的高维BoW 表示映射到低维的语义表示上,主要有 pLSA 模型[15-16]和 LDA 模型[17-18]。这两类方法是对图像特征进行提取分析后,在不同的层次上描述场景内容从而完成对场景图像的分类。1.2.2 基于图像局部与全局特征的场景分类方法


本文编号:2997723

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2997723.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2e7e4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com