一种新的基于无损失函数的深度卷积神经网络的图像特征提取方法
本文选题:图像识别 切入点:图像特征提取 出处:《山东大学》2017年硕士论文 论文类型:学位论文
【摘要】:作为人工智能的重要技术之一,图像识别技术已经在社会的各个领域被广泛应用。例如:集装箱号码图像自动识别,人脸图像识别,病理图像自动识别等等。对于一个成熟的图像识别系统,其主要步骤可以分为四步:图像采集与预处理,目标图像定位和分割,图像特征提取,特征识别与分类。其中,图像特征提取是其最为重要的组成步骤。提取到的图像特征的质量直接影响着最终的分类结果。近年来,随着深度学习的发展,越来越多的图像特征提取采用了深度学习技术。由于深度卷积神经网络本身独特的结构优势,使其成为众多给予深度学习的图像识别程序中最为主流的图像特征提取手段。然而,由于目前深度学习研究趋势向着多层次,更复杂的方向,训练一个收敛的深度网络难度越来越高,不仅需要调整越来越多的参数,还需要保证其损失函数的收敛性,有时候还需要整合一些现有的训练技巧,例如dropout,maxout等。近年来,随着简单深度学习结构的提出,越来越多的研究人员着眼于这种无损失函数的深度学习模型。其中,最为著名的是PCANet深度卷积网络模型。其无损失函数的特性使得网络训练的难度大大降低。然而,由于其选择使用的无监督的主成分分析(Principal Component Analysis,PCA)算法进行卷积核的训练,使得最终的图像识别效果并不是那么理想。虽然随后基于监督学习的线性判别式分析(Linear Discriminant Analysis,LDA)方法来训练卷积核的深度学习模型LDANet被提出,但是由于LDA算法自身正负样本分离能力的局限性,使得LDANet模型的图像识别结果并无显著提升。并且,因为其特有的下采样方式,使其极易产生过度拟合现象。使得训练效果不尽如人意。在此论文中,针对PCANet与LDANet所出现的问题,主要做出了以下的贡献:1)本文基于PCANet的基本结构,创造性地将Marginal Fisher Analysis(MFA)引入卷积核的训练,提出了一种新的简单深度学习架构MFANet。由于MFA采取监督学习的方式,并且通过提取后的特征向量进行映射,使得投影后的正样本之间的距离尽可能小,同时保证负样本之间的距离尽可能大。使得卷积同类图像所得的特征与卷积后的异类图像特征在新的特征空间得以有效分离。本文运用标准数据集:字符识别数据集ICDAR2003,测试所提出的深度模型的识别性能,并且通过和一些流行的图像特征提取模型进行比较,最终的图像分类的结果表明MFANet模型的特征提取能力比其他深度模型要好。2)本文提出了一种新的下采样方法:基于概率的块级随机直方图化,来解决基于PCANet的模型所具有的鲁棒性不强的特点。该方法的核心是计算块级像素出现概率,并基于该概率去采样决定块级特征像素点是否保留,最终运用直方图输出特征。通过运用图像识别数据集:PIE FACE数据集,将所提出的下采样方法所池化的特征分类结果的与其它流行的下采样后的特征分类结果进行比较,实验结果表明本文所提出的方法有效地减少了过拟合现象。
[Abstract]:As one of the important technology of artificial intelligence, image recognition technology has been widely used in various fields of society. For example: automatic identification of container number image, face image recognition, image recognition and so on. The pathological image recognition system for a mature, the main steps can be divided into four steps: image acquisition and preprocessing, target image location and segmentation, feature extraction, feature recognition and classification. The image feature extraction is the most important component steps. The quality of image feature extraction to directly affect the final classification result. In recent years, with the development of deep learning, image feature extraction has been used increasingly deep learning technology due to structural advantage of deep convolutional neural network is unique, which give as many image features most mainstream image recognition program to extract deep learning means. However, due to the current trend towards multi-level deep learning research, more complex direction, depth of network is more and more high training a convergence, not only need to adjust the parameters of more and more, but also need to ensure the convergence of the loss function, sometimes also need to integrate some of the existing training techniques, such as dropout, maxout etc. in recent years. With the development of deep learning, simple structure, focus on the deep learning model to the loss function more and more researchers. Among them, the most famous is the PCANet network model. The depth of the convolution loss function makes the network training difficulty is greatly reduced. However, due to the choice of unsupervised use of principal components the analysis (Principal Component Analysis PCA) algorithm for convolution kernel training, makes the image recognition of the final result is not so ideal. Although based on supervised learning The linear discriminant analysis (Linear Discriminant, Analysis, LDA) for training the convolution kernel deep learning model LDANet was proposed, but due to the limitation of the LDA algorithm's positive and negative samples separation ability, makes the LDANet model image recognition results there is no significant improvement. And, because of its unique sampling methods, make it easy over fitting phenomenon. The training effect is not satisfactory. In this paper, the PCANet and LDANet for the problem, mainly made the following contributions: 1) in this paper, the basic structure of PCANet based on Marginal Fisher Analysis (creative MFA) the introduction of convolution kernel training, proposes a new simple deep learning the architecture of MFANet. MFA take the supervised learning method, mapping and through the extracted feature vector, which is between the sample after projection distance as small as possible, at the same time. The distance between the card negative samples as large as possible. The heterogeneous characteristics and image features of similar images obtained by convolution convolution can be effectively separated in the new feature space. By using the standard data set: ICDAR2003 character recognition data set, the recognition performance of the proposed depth model test, and through the comparison of extraction model and image features some of the popular image classification, the final results show that the feature extraction ability of MFANet model is better than the other depth model.2) this paper proposes a new sampling method: the probability of random block level histogram based, to solve the robustness of PCANet model based on the core is not strong. The method is to calculate the pixel block probability, and based on the sampling probability to decide whether the pixel block features retained, finally using histogram output characteristics. Through the use of image recognition Other data sets: PIE FACE dataset, comparing the proposed classification results with the other popular classification results, and the experimental results show that the proposed method effectively reduces the over fitting phenomenon.
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41;TP183
【相似文献】
相关期刊论文 前10条
1 李尹岑;孔祥云;杨德智;;肝脏CT图像特征提取方法的研究及其在检索中的应用[J];影像技术;2014年01期
2 龚雯,陈丽华,沈建国;基于几何特征的人脸正面图像特征提取[J];现代计算机;2005年09期
3 尚丽;陈杰;周燕;张丽;;基于非负稀疏编码的图像特征提取及应用[J];苏州市职业大学学报;2007年02期
4 李雅梅;吴中福;;川南石刻图像特征提取方法研究[J];计算机科学;2008年06期
5 翟俊海;赵文秀;王熙照;;图像特征提取研究[J];河北大学学报(自然科学版);2009年01期
6 王志瑞;闫彩良;;图像特征提取方法的综述[J];吉首大学学报(自然科学版);2011年05期
7 白明柱;杨立森;阿木古楞;;图像特征提取的研究进展[J];科技创新与应用;2013年04期
8 刘凤连;汪日伟;程俊;康绢鹏;;图像特征提取中领域尺寸和本征维数的自动选择算法[J];光电子.激光;2013年12期
9 范羚,吴小培,龙飞,张道信,郭晓静;基于独立分量分析的图像特征提取及去噪[J];计算机工程与应用;2003年09期
10 林明星,王晓华,管志光,丁凤华,赵永瑞;基于差分码的图像特征提取方法研究[J];仪器仪表学报;2004年S2期
相关会议论文 前9条
1 林明星;王晓华;管志光;丁凤华;赵永瑞;;基于差分码的图像特征提取方法研究[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
2 朱红娟;苏立军;李芬华;陈丽;;基于小波包的超声图像特征提取[A];第七届全国信息获取与处理学术会议论文集[C];2009年
3 张永平;何仲昆;苏日娜;樊少菁;;基于非线性投影的图像特征提取与分类[A];2009年中国智能自动化会议论文集(第三分册)[C];2009年
4 王晓伟;石林锁;成浩;;基于独立分量分析的图像特征提取[A];第十七届全国测控计量仪器仪表学术年会(MCMI'2007)论文集(上册)[C];2007年
5 夏庆观;路红;陈桂;;基于小波神经网络的零件图像特征提取和识别[A];第三届全国信息获取与处理学术会议论文集[C];2005年
6 黄亚丽;刘志文;时永刚;王琳;;一种基于形状和形变的细胞视频图像特征提取方法[A];2012医疗仪器与民众健康学术研讨会论文集[C];2012年
7 索芳;魏世泽;;农田杂草图像特征提取与识别方法的探讨[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
8 柳林霞;陈杰;陈文颉;;自动目标识别技术中的图像特征提取技术[A];第二十一届中国控制会议论文集[C];2002年
9 罗仁泽;王汝言;冉瑞生;;二维PCA法策略及证明[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
相关博士学位论文 前10条
1 黄晟;图像特征提取与分类超图的学习算法研究[D];重庆大学;2015年
2 刘茜;彩色人脸图像特征提取方法研究[D];南京邮电大学;2015年
3 王维刚;基于时频图像识别的旋转机械多特征融合故障诊断方法研究[D];哈尔滨工业大学;2016年
4 刘淑琴;图像特征提取方法及其应用研究[D];西北大学;2016年
5 钱建军;人脸图像特征提取和分类的若干方法研究[D];南京理工大学;2014年
6 施展;图像特征提取与识别的迹空间投影方法研究[D];华南理工大学;2012年
7 伍爵博;基于云模型与数据场的图像特征提取研究[D];武汉大学;2010年
8 汤德俊;人脸识别中图像特征提取与匹配技术研究[D];大连海事大学;2013年
9 李勇智;图像特征提取方法及其在人脸识别中的应用[D];南京理工大学;2009年
10 刘高峰;极化SAR图像特征提取与分类方法研究[D];西安电子科技大学;2014年
相关硕士学位论文 前10条
1 康欣;草本植物图像特征提取与分类研究[D];东北林业大学;2015年
2 初延亮;磁粉检测裂纹图像特征提取方法研究及实现[D];西南科技大学;2015年
3 王晓晓;基于拓扑结构的人脸图像特征提取及识别研究[D];青岛科技大学;2015年
4 孙洪飞;基于小波变换的图像特征提取方法研究[D];南京邮电大学;2015年
5 马利兴;基于图像特征提取的风电传动机械故障诊断技术研究[D];北京信息科技大学;2015年
6 张轶丞;基于视觉词袋的Visual-map图像特征提取与分类算法[D];哈尔滨工业大学;2016年
7 姜媛;极化SAR图像特征提取与分类方法研究[D];电子科技大学;2016年
8 陈锦;基于时频分析方法的单细胞图像特征提取及识别方法研究[D];广西师范大学;2016年
9 程安凤;基于人脸识别的图像特征提取研究与实现[D];江西农业大学;2016年
10 何德鲁;基于时频图像特征提取的旋转机械故障诊断研究[D];大连理工大学;2016年
,本文编号:1592323
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1592323.html