卷积神经网络在手绘草图识别中的应用研究
发布时间:2017-05-24 16:26
本文关键词:卷积神经网络在手绘草图识别中的应用研究,由笔耕文化传播整理发布。
【摘要】:随着数字技术、人工智能和互联网的不断发展,我们的生活被繁多的图像信息所包围,而且图像的分辨率变得越来越高,存储图像所需的容量越来越大,所需的存储方法也变得越来越多样化,这些都使得现如今的图像数据库不管是在信息量,还是在数量上都大的惊人。目前,图像处理、图像识别和图像检索等领域的主要挑战在于要求更低的时间消耗、更高的准确率和提取更通用的特征。手绘草图是人类最直观且最原始的沟通工具。近年来,随着智能可触屏设备的普及,手绘草图可以轻松地从手机、平板电脑、手写画板上获取,手绘草图的相关研究吸引了越来越多国内外专家学者的注意。目前已有的手绘草图识别方法严重依赖于手工提取特征,如提取区域、轮廓等图像的低层特性,但是由于手绘草图中线条的多变性、个人的主观因素以及不同人绘画基础的不确定性等原因,使得人工提取特征变得十分困难,同时手工提取费时费力且依靠运气,导致了现有的手绘草图的识别率较低,且通用性较差。近年来,深度学习已成为人工智能领域中备受瞩目的研究热点。作为经典的深度学习模型,卷积神经网络在语音识别、姿势识别、图像识别等领域都取得了巨大的成功。但是,经典的卷积神经网络模型主要是为彩色多纹理自然图像设计,手绘草图与之相比,缺少了颜色、纹理等信息。手绘草图一般为二值图像或者灰度图像,具有高度的抽象性和夸张性,并且存在由于用户绘制过程中的停顿和不连贯导致草图轮廓不完整等问题,使得现有模型,如在ImageNet上训练得到的卷积神经网络模型AlexNet,在识别手绘草图时效果并不理想。相较于基于低层的局部图像描述子,卷积神经网络模型能在中间层表述上获得更丰富的表达,但是缺乏几何不变性。而Fisher向量从数学的角度提出了生成概率模型与判别内核方法相结合,具有较好的局部不变性,广泛应用于图像分类、目标识别等领域,特别是结合着BOW(Bag-of-Word,词袋)模型。最近Schneider把Fisher向量应用到了手绘草图上,并取得较好的识别率,但是却没有根据手绘草图的特性进行设计,即相对于彩色多纹理自然图像,手绘草图没有平滑的渐变且更稀疏,并且没有考虑到使用草图的笔画顺序。本文对卷积神经网络在手绘草图识别中的应用进行了深入的研究,主要完成的工作和创新点如下:1.本章提出了一种基于卷积神经网络的手绘草图识别方法,该方法根据手绘图像多结构少纹理信息的特点,使用大尺寸的首层卷积核取代自然图像识别中常使用的小尺寸首层卷积核。由于自然图像的纹理较丰富,使用小卷积核能够提取到细节的变化,而手绘草图缺少这些纹理信息,当使用小卷积核时,会导致大部分提取到的特征为空,使得传递给第二层卷积核的信息较少,信息丢失过快,不能很好地获得草图的结构信息。训练浅层模型作为深层模型对应层的初始值,并加入不改变特征大小的卷积层,不仅加深网络深度、减小模型误差,而且减少训练时长,加快收敛。加入不改变特征大小的卷积层来加深网络深度等方法以降低错误率。2.本章提出了一种融合卷积神经网络和Fisher向量的手绘草图识别方法,该方法根据Fisher向量判别力强的特点,通过对图片使用一个预训练的卷积神经网络,取第8卷积层的输出特征使用Fisher向量,这样可以丰富图像特征的表达,并降低分类器训练的复杂度。由于笔画信息是用户绘制时同步记录的,能够反应用户对事物的理解,一般按照先主要后细节的顺序进行绘制,因此添加笔画信息,在区分两个相似类的图像时,即使局部相似,但却可能存在不一样的笔画顺序,有助于图像识别。使用图像翻转和切片用于数据扩充,可以有效减少过拟合,增加几何不变性。为了验证融合卷积神经网络和Fisher向量的识别方法的有效性,本章对Eits收集的250类手绘草图进行识别,得到了良好的识别率。
【关键词】:手绘草图识别 卷积神经网络 Fisher向量 图像识别
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【目录】:
- 摘要3-5
- Abstract5-9
- 第1章 绪论9-15
- 1.1 研究背景及意义9-10
- 1.2 国内外研究现状10-14
- 1.3 本文的主要内容和结构14
- 1.4 本章小结14-15
- 第2章 相关技术简介15-28
- 2.1 图像特征描述15-18
- 2.1.1 纹理特征15-16
- 2.1.2 轮廓特征16-17
- 2.1.3 SIFT特征17-18
- 2.2 卷积神经网络18-22
- 2.2.1 卷积神经网络模型19-20
- 2.2.2 机器学习训练方法20-22
- 2.3 Fisher向量22-27
- 2.3.1 Fisher核22-24
- 2.3.2 Fisher向量(FV)在图像上的应用24-25
- 2.3.3 Fisher向量归一化25-27
- 2.4 本章小结27-28
- 第3章 基于卷积神经网络的手绘草图识别28-36
- 3.1 全模型28-30
- 3.2 实验设计30-33
- 3.2.1 数据集介绍30-31
- 3.2.2 参数设定与选择31-33
- 3.3 实验结果与分析33-35
- 3.4 本章小结35-36
- 第4章 融合卷积神经网络和Fisher向量的手绘草图识别36-45
- 4.1 全模型36-38
- 4.2 实验设计38-42
- 4.2.1 数据集处理38-40
- 4.2.2 实验步骤40-41
- 4.2.3 参数设定与选择41-42
- 4.3 实验结果与分析42-44
- 4.4 本章小结44-45
- 第5章 结论与展望45-47
- 5.1 总结45-46
- 5.2 展望46-47
- 参考文献47-53
- 附录53-54
- Appendix54-55
- 致谢55-56
- 攻读硕士学位期间发表的论文及获奖情况56
【参考文献】
中国期刊全文数据库 前2条
1 高学;王有旺;;基于CNN和随机弹性形变的相似手写汉字识别[J];华南理工大学学报(自然科学版);2014年01期
2 李海峰;李纯果;;深度学习结构和算法比较分析[J];河北大学学报(自然科学版);2012年05期
中国博士学位论文全文数据库 前1条
1 刘建军;基于图像局部不变特征的类属超图构建与目标识别技术研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前2条
1 朱伟伟;基于手绘草图的图像检索方法研究[D];安徽大学;2014年
2 李萌;基于特征选择的Fisher向量在图像分类中的应用[D];北京交通大学;2014年
本文关键词:卷积神经网络在手绘草图识别中的应用研究,由笔耕文化传播整理发布。
,本文编号:391356
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/391356.html