基于卷积神经网络的帽子多分类方法研究与应用
发布时间:2020-05-07 08:35
【摘要】:面对海量图片,如何对图片内容进行智能搜索分类是计算机视觉领域研究的一个经典问题。图像分类是要求分辨出一张图像中是否包含某种物体。基于内容的图像分类技术主要分为三个步骤:对图像进行特征提取,对提取后的特征进行特征表达和使用分类器进行分类。为解决海量图像难以智能搜索分类问题,本文主要研究帽子多分类问题,用于特定场合下智能搜索分类。首先本文研究和分析基于图像内容的经典传统图像分类算法,分别是特征提取算法和分类算法,并实现KNN分类算法。实验结果表明:传统的图像分类方法准确率和处理时间都不能满足人们的需求,此外,对于复杂场景和图像质量不佳等情况的误检率特别高。之后,本文主要研究基于卷积神经网络的帽子多分类问题,本文主要的研究内容如下:(1)针对帽子多分类问题,研究并设计一个5层的卷积神经网络结构,在设计网络结构时,增加一个BN层,同时将卷积层和BN层合并在一起。增加BN层的目的是它将数据归一化后,能够有效解决梯度消失与梯度爆炸问题,同时能够加速网络收敛和控制过拟合。将卷积层合并BN层的目的是减少运算,减少占用更多的内存或显存空间,提高模型前向推断的速度。此外,考虑到网络结构计算量的问题,所有的卷积层卷积核的大小都采用3x3,降低网络结构的计算量。(2)针对帽子数据集不充分的情况,研究在caffe框架上增加数据增广功能。对caffe源码进行修改,增加数据增广的功能,然后通过在网络结构给参数赋值,系统进行图像增广。方法的原理主要是通过随机旋转图像,裁剪图像,改变图像色度,改变图像饱和度,改变图像亮度,改变图像尺寸大小等,进行对样本数据增。(3)针对图像质量不佳的情况,进行光照预处理。对于图像光照不均匀在一定程度上改变图像的原始面貌,从而使模型检测结果出错。为提高模型的检测效果。研究在模型进行测试之前,对图像进行光照预处理,提高模型正检率。(4)将实验优化得到的模型,应用到基于图像内容的帽子多分类智能搜索系统中,设计并实现一个简单的网页智能搜索系统,验证模型优化的结果。根据本文设计出的网络结构以及优化方法训练得到的模型,检测的平均正检率可以达到0.96以上,已经很好的应用到某些特定场景下的智能搜索分类中。
【学位授予单位】:江苏科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP183
【学位授予单位】:江苏科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP183
【相似文献】
相关期刊论文 前10条
1 胡悦;;金融市场中的神经网络拐点预测法[J];金融经济;2017年18期
2 迟惠生;陈珂;;1995年世界神经网络大会述评[J];国际学术动态;1996年01期
3 吴立可;;脉冲神经网络和行为识别[J];通讯世界;2018年12期
4 林嘉应;郑柏伦;刘捷;;基于卷积神经网络的船舶分类模型[J];信息技术与信息化;2019年02期
5 俞颂华;;卷积神经网络的发展与应用综述[J];信息通信;2019年02期
6 韩真;凯文·哈特尼特;;为神经网络的通用理论建造基石[J];世界科学;2019年04期
7 鲍伟强;陈娟;熊涛;;基于进化神经网络的短期电力负荷预测研究[J];电工技术;2019年11期
8 陈晓燕;;浅析简单神经网络的发展及简单模型[J];数字技术与应用;2019年05期
9 王丽华;杨秀萍;王皓;高峥翔;;智能双轮平衡车的设计研究[J];数字技术与应用;2018年04期
10 张庭略;;基于硬件的神经网络加速[J];通讯世界;2018年08期
相关会议论文 前10条
1 孙军田;张U,
本文编号:2652711
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2652711.html