基于目标的场景图像表示及分类
本文关键词:基于目标的场景图像表示及分类
【摘要】:在计算机视觉领域中,图像的编码表示一直是至关重要的技术之一。传统的基于低层特征的图像表示方法是有效可行的,且得到了广泛的应用;然而,从人类认知的角度出发,人类更多地倾向于基于目标的场景图像表示方法。在本文中,我们针对场景图像中的目标对象提出两种高层的图像表示方法,并成功将其应用在场景分类中。为了获得图像中所包含的目标信息,我们采用了图像的标注信息和现存的语义分割算法,在此基础上提出第一种基于目标的表示方法,并生成了两种对应的场景分类模型。该目标表示方法主要包含三个部分:第一步,统计出图像中所包含的目标信息,建立目标对象的特征直方图;第二步,采用高斯混合方法建立目标的空间几何先验模型,从而建立整个图像的空间几何直方图,抓取目标对象的位置信息和大小信息;第三步,构建共现直方图抽取各个目标与目标之间共同出现的频率、相对位置等特征信息。利用卷积神经网络在目标检测和识别中所表现的独特优势,将场景图像经卷积神经网络处理,在此基础上提出第二种基于目标的表示方法,并生成结合卷积神经网络的目标表示分类模型。通过提取网络中pool5层的特征,获得图像中的有关目标信息作为图像的表示。在实验中,我们依次对基于标注信息的目标表示模型、结合语义分割的目标表示模型、结合卷积神经网络的目标表示模型进行了验证,结果表明本文所提出的两种基于目标的图像表示方法是非常有效的。
【关键词】:场景分类 图像表示 语义分割 卷积神经网络
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【目录】:
- 摘要6-7
- ABSTRACT7-10
- 第一章 绪论10-14
- 1.1 课题背景与研究意义10-11
- 1.2 场景分类的研究现状及存在难点11-12
- 1.3 论文研究内容与创新点12-13
- 1.4 论文组织结构13-14
- 第二章 场景分类图像表示及相关理论14-20
- 2.1 低层特征图像表示方法14-16
- 2.1.1 局部特征14-15
- 2.1.2 全局特征15
- 2.1.3 低层特征比较分析15-16
- 2.2 语义特征图像表示方法16-17
- 2.3 基于深度学习特征的图像表示方法17-19
- 2.3.1 卷积神经网络17-18
- 2.3.2 AlexNet网络18-19
- 2.4 本章小结19-20
- 第三章 基于图像标注信息的目标表示模型20-24
- 3.1 目标直方图20-21
- 3.2 空间几何直方图21-22
- 3.3 共现直方图22-23
- 3.4 本章小结23-24
- 第四章 结合语义分割的目标表示模型24-29
- 4.1 语义分割24-28
- 4.1.1 O2P算法25-27
- 4.1.2 O2P算法结果分析27-28
- 4.2 基于目标的图像表示方法28
- 4.2.1 目标直方图28
- 4.2.2 空间几何直方图和共现直方图28
- 4.3 本章小结28-29
- 第五章 结合卷积神经网络的目标表示模型29-37
- 5.1 卷积神经网络各层特征分析29-34
- 5.1.1 ImageNet-CNN各层特征分析29-32
- 5.1.2 Places-CNN高层特征分析32-34
- 5.2 结合卷积神经网络的目标表示34-36
- 5.2.1 VGG深度卷积神经网络结构35
- 5.2.2 目标直方图35-36
- 5.3 本章小结36-37
- 第六章 实验37-53
- 6.1 结合标注信息的目标表示方法验证37-41
- 6.1.1 LabelMe 8类室外场景库38-40
- 6.1.2 MIT室内5类场景库40-41
- 6.2 结合语义分割的目标表示模型验证41-44
- 6.2.1 LabelMe 8类室外场景库42-43
- 6.2.2 MIT室内5类数据库43-44
- 6.3 结合卷积神经网络的目标表示模型验证44-49
- 6.3.1 VGG-16卷积神经网络pool5层特征分析44-45
- 6.3.2 小数据集上结果比较分析45-47
- 6.3.3 大规模数据集上结果比较分析47-49
- 6.4 与其他方法的比较49-51
- 6.4.1 与低层特征方法的比较49-50
- 6.4.2 与语义特征方法的比较50
- 6.4.3 与其他结合卷积神经网络分类方法的比较50-51
- 6.5 本章小结51-53
- 第七章 总结和展望53-54
- 附录54-55
- 参考文献55-60
- 致谢60
【相似文献】
中国期刊全文数据库 前10条
1 黄巍;陈传波;郑运平;吴雪丽;;可重叠矩形多值图像表示及其上的几何矩生成[J];计算机科学;2008年10期
2 陶金金;黄秀清;陆云;高强;;基于重叠矩形图像表示方法的贝塞尔-傅里叶矩快速计算[J];软件导刊;2013年07期
3 曹奎,冯玉才,王元珍;一种基于颜色的图像表示及全局相似检索技术[J];计算机研究与发展;2001年09期
4 程兵,贾新春,郑南宁,袁泽剑;基于水平差集的多精度图像表示及绘制[J];西安交通大学学报;2002年04期
5 黄巍;陈传波;郑运平;吴雪丽;;基于非对称逆布局图像表示的近邻寻找算法[J];计算机工程与科学;2009年03期
6 舒振球;赵春霞;张浩峰;;局部敏感的稀疏概念编码及其在图像表示中的应用[J];计算机辅助设计与图形学学报;2014年01期
7 康寅;杨文川;;图像表示及在检索系统中的应用[J];软件;2011年01期
8 宋彦;蒋兵;戴礼荣;;基于多视觉码本的图像表示[J];模式识别与人工智能;2013年10期
9 刘艳丽,曹奎;一种基于PCA的图像表示与检索技术[J];计算机应用与软件;2003年04期
10 张琳波;王春恒;肖柏华;邵允学;;基于Bag-of-phrases的图像表示方法[J];自动化学报;2012年01期
中国重要会议论文全文数据库 前1条
1 于万波;赵庆贤;易欣;;基于神经网的图像表示方法[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年
中国重要报纸全文数据库 前1条
1 池健;信息技术在设计工作中的反映[N];中华建筑报;2008年
中国博士学位论文全文数据库 前10条
1 江波;基于图理论与稀疏约束模型的图像表示、匹配与识别[D];安徽大学;2015年
2 谢凌曦;基于局部特征的图像表示模型理论与实践[D];清华大学;2015年
3 朱杰;基于颜色词袋模型的图像表示方式[D];北京交通大学;2016年
4 李大瑞;基于大规模视觉模式学习的高性能图像表示[D];中国科学技术大学;2014年
5 黄巍;基于可重叠矩形子模式的图像表示和操作方法研究[D];华中科技大学;2008年
6 李亚峰;图像表示的若干问题研究[D];西安电子科技大学;2011年
7 吴中;大规模图像搜索中的图像表示模型[D];清华大学;2010年
8 肖延辉;基于矩阵分解的图像表示理论及其应用研究[D];北京交通大学;2014年
9 吴雪丽;基于斜面分解的非对称逆布局图像表示方法与处理算法研究[D];华中科技大学;2009年
10 郑运平;基于Gouraud阴影法和多子模式的NAM图像表示方法研究[D];华中科技大学;2008年
中国硕士学位论文全文数据库 前3条
1 焦绪国;基于单层稀疏自编码和支持向量机的场景分类[D];重庆大学;2015年
2 罗序辉;基于目标的场景图像表示及分类[D];华东师范大学;2016年
3 陆永亮;基于偏微分方程和多边形的非对称逆布局图像表示方法研究[D];华中科技大学;2009年
,本文编号:905121
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/905121.html