基于颜色词袋模型的图像表示方式

发布时间:2017-12-17 17:12

  本文关键词:基于颜色词袋模型的图像表示方式


  更多相关文章: 对象识别 形状 颜色 有判别力的颜色 对象颜色 颜色注意力图 颜色上下文注意力 阈值 图像层次 特征挖掘 多图像匹配 种子-膨胀策略 匹配集


【摘要】:对象识别是计算机视觉领域的一个基本问题,生成有判别力的图像表示是解决这个问题的一种重要方法。词袋模型(Bag-of-Words, BOW)是一种常用的图像表示方式,它把局部的特征抽象成为视觉词,通过统计视觉词在图像中出现的频率来进行图像表示。目前,BOW的主要问题包括只考虑了形状特征和没有引入空间信息等问题。本文针对这些问题,利用颜色作为发现对象区域的手段,融合形状和颜色特征生成了更有判别力的图像表示。本文取得的主要研究成果如下:(1)提出了颜色合并的图像表示方法。此方法用图像块的颜色给形状特征加权,并且能够通过对对象颜色的估计与合并,在图像表示的时候给对象上的图像块赋予相同的高权值。算法认为对象是有判别力颜色的图像块集合,但是由于这些有判别力的颜色出现的概率不同,导致了对象上的图像块不能够被赋予相同的高权值,算法通过对类内和类间颜色相似性的判断,以优化的方式得到了每个类别中有判别力的颜色,最后通过合并颜色给图像块赋权值。实验结果证明了提出的图像表示方法的优越性。(2)提出了上下文颜色注意力图的图像表示方式。该方法把所有的颜色分为两种,即强颜色和弱颜色,相应的,拥有这两种颜色的图像块被称为强图像块和弱图像块。其中强图像块都是对象上的图像块,弱图像块被认为是背景上的图像块。为了识别出对象上的图像块,我们利用强图像块和弱图像块的上下文位置关系,计算出上下文颜色注意力值,并通过优化得到上下文颜色注意力阈值来判断出对象上的伪弱图像块。实验结果表明,我们提出的基于上下文颜色注意力的对象识别方法能够比自顶向下的颜色注意图(Color Attention,CA)方法获得更好的识别效果。(3)提出了基于成分金字塔匹配(Component Pyramid Matching,CPM)的图像表示方法,CPM利用颜色对图像进行分层,每层的前景和背景代表着不同的成分,前景成分通常对应着对象的一部分,最后把不同成分的表示连接起来作为最终的图像表示。CPM的划分方法能够为图像表示提供空间信息,在与颜色相关的图像库中取得了良好的识别效果(4)提出了一种中间层特征的层次挖掘方法。该方法首先用有判别力的颜色对图像进行层次划分,然后把每一个层次中的图像块认为是一个子类,通过挖掘子类中图像块的特征发现图像中的模式,最终用模式集代替视觉词来表示图像。这种方法有利于发现不同层次中特征之间的关系,实验结果证明了提出方法的有效性。(5)提出了一种基于多图像匹配的图像表示方式。该方法把图像块认为是节点,每一个节点与其近邻的节点相连用于生成图。同类图像中能够匹配的子图即为对象所在的区域。我们采用了一种种子-膨胀的策略进行多图像的匹配。把有判别力的颜色作为了判断种子的重要依据。接下来用得到的匹配集图来匹配所有的图像用于找到对象上的图像块。最终,这些图像块的特征被用于图像表示。实验结果验证了所提方法的优越性。基于颜色合并与上下文颜色注意力图的方法主要是利用颜色作为形状特征加权的依据,而成分金字塔与层次挖掘的方法则把颜色作为划分层次的标准,用以为图像表示增加空间信息。最后,提出的多图像匹配的方法把有判别力的颜色作为发现种子的重要依据,并且获得了这些方法中的最好分类结果。
【学位授予单位】:北京交通大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP391.41

【相似文献】

中国期刊全文数据库 前10条

1 黄巍;陈传波;郑运平;吴雪丽;;可重叠矩形多值图像表示及其上的几何矩生成[J];计算机科学;2008年10期

2 陶金金;黄秀清;陆云;高强;;基于重叠矩形图像表示方法的贝塞尔-傅里叶矩快速计算[J];软件导刊;2013年07期

3 曹奎,冯玉才,王元珍;一种基于颜色的图像表示及全局相似检索技术[J];计算机研究与发展;2001年09期

4 程兵,贾新春,郑南宁,袁泽剑;基于水平差集的多精度图像表示及绘制[J];西安交通大学学报;2002年04期

5 黄巍;陈传波;郑运平;吴雪丽;;基于非对称逆布局图像表示的近邻寻找算法[J];计算机工程与科学;2009年03期

6 舒振球;赵春霞;张浩峰;;局部敏感的稀疏概念编码及其在图像表示中的应用[J];计算机辅助设计与图形学学报;2014年01期

7 康寅;杨文川;;图像表示及在检索系统中的应用[J];软件;2011年01期

8 宋彦;蒋兵;戴礼荣;;基于多视觉码本的图像表示[J];模式识别与人工智能;2013年10期

9 刘艳丽,曹奎;一种基于PCA的图像表示与检索技术[J];计算机应用与软件;2003年04期

10 张琳波;王春恒;肖柏华;邵允学;;基于Bag-of-phrases的图像表示方法[J];自动化学报;2012年01期

中国重要会议论文全文数据库 前1条

1 于万波;赵庆贤;易欣;;基于神经网的图像表示方法[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年

中国重要报纸全文数据库 前1条

1 池健;信息技术在设计工作中的反映[N];中华建筑报;2008年

中国博士学位论文全文数据库 前10条

1 江波;基于图理论与稀疏约束模型的图像表示、匹配与识别[D];安徽大学;2015年

2 谢凌曦;基于局部特征的图像表示模型理论与实践[D];清华大学;2015年

3 朱杰;基于颜色词袋模型的图像表示方式[D];北京交通大学;2016年

4 李大瑞;基于大规模视觉模式学习的高性能图像表示[D];中国科学技术大学;2014年

5 黄巍;基于可重叠矩形子模式的图像表示和操作方法研究[D];华中科技大学;2008年

6 李亚峰;图像表示的若干问题研究[D];西安电子科技大学;2011年

7 吴中;大规模图像搜索中的图像表示模型[D];清华大学;2010年

8 肖延辉;基于矩阵分解的图像表示理论及其应用研究[D];北京交通大学;2014年

9 吴雪丽;基于斜面分解的非对称逆布局图像表示方法与处理算法研究[D];华中科技大学;2009年

10 郑运平;基于Gouraud阴影法和多子模式的NAM图像表示方法研究[D];华中科技大学;2008年

中国硕士学位论文全文数据库 前2条

1 焦绪国;基于单层稀疏自编码和支持向量机的场景分类[D];重庆大学;2015年

2 陆永亮;基于偏微分方程和多边形的非对称逆布局图像表示方法研究[D];华中科技大学;2009年



本文编号:1300909

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1300909.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户88255***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com