当前位置:主页 > 科技论文 > 自动化论文 >

卷积神经网络研究综述

发布时间:2018-03-02 02:03

  本文关键词: 卷积神经网络 深度学习 网络结构 训练方法 领域数据 出处:《计算机学报》2017年06期  论文类型:期刊论文


【摘要】:作为一个十余年来快速发展的崭新领域,深度学习受到了越来越多研究者的关注,它在特征提取和建模上都有着相较于浅层模型显然的优势.深度学习善于从原始输入数据中挖掘越来越抽象的特征表示,而这些表示具有良好的泛化能力.它克服了过去人工智能中被认为难以解决的一些问题.且随着训练数据集数量的显著增长以及芯片处理能力的剧增,它在目标检测和计算机视觉、自然语言处理、语音识别和语义分析等领域成效卓然,因此也促进了人工智能的发展.深度学习是包含多级非线性变换的层级机器学习方法,深层神经网络是目前的主要形式,其神经元间的连接模式受启发于动物视觉皮层组织,而卷积神经网络则是其中一种经典而广泛应用的结构.卷积神经网络的局部连接、权值共享及池化操作等特性使之可以有效地降低网络的复杂度,减少训练参数的数目,使模型对平移、扭曲、缩放具有一定程度的不变性,并具有强鲁棒性和容错能力,且也易于训练和优化.基于这些优越的特性,它在各种信号和信息处理任务中的性能优于标准的全连接神经网络.该文首先概述了卷积神经网络的发展历史,然后分别描述了神经元模型、多层感知器的结构.接着,详细分析了卷积神经网络的结构,包括卷积层、池化层、全连接层,它们发挥着不同的作用.然后,讨论了网中网模型、空间变换网络等改进的卷积神经网络.同时,还分别介绍了卷积神经网络的监督学习、无监督学习训练方法以及一些常用的开源工具.此外,该文以图像分类、人脸识别、音频检索、心电图分类及目标检测等为例,对卷积神经网络的应用作了归纳.卷积神经网络与递归神经网络的集成是一个途径.为了给读者以尽可能多的借鉴,该文还设计并试验了不同参数及不同深度的卷积神经网络来分析各参数间的相互关系及不同参数设置对结果的影响.最后,给出了卷积神经网络及其应用中待解决的若干问题.
[Abstract]:As a new field of rapid development in the past ten years, in-depth learning has attracted more and more researchers' attention. It has obvious advantages over shallow model in feature extraction and modeling. Depth learning is good at mining more and more abstract feature representations from raw input data. These representations have a good generalization ability. They overcome some of the problems that used to be difficult to solve in artificial intelligence. And with the significant increase in the number of training data sets and the rapid increase in chip processing power, It has been effective in target detection and computer vision, natural language processing, speech recognition and semantic analysis, thus promoting the development of artificial intelligence. Deep neural network is the main form at present. The connection pattern between neurons is inspired by animal visual cortical tissue, and convolutional neural network is one of the classical and widely used structures. The characteristics of weight sharing and pool operation can effectively reduce the complexity of the network, reduce the number of training parameters, make the model invariant to a certain extent for translation, distortion and scaling, and have strong robustness and fault-tolerant ability. It is also easy to train and optimize. Based on these advantages, it performs better than standard fully connected neural networks in various signal and information processing tasks. In this paper, the development history of convolutional neural networks is first summarized. Then we describe the neuron model and the structure of multilayer perceptron respectively. Then, we analyze the structure of convolutional neural network in detail, including convolution layer, pool layer, full junction layer, which play different roles. In this paper, the improved convolution neural networks such as network model and spatial transformation network are discussed. At the same time, the supervised learning, unsupervised learning training methods and some common open source tools of convolutional neural networks are also introduced. This paper takes image classification, face recognition, audio retrieval, ECG classification and target detection as examples. The application of convolution neural network is summarized. The integration of convolutional neural network and recurrent neural network is a way. In this paper, convolution neural networks with different parameters and different depths are designed and tested to analyze the relationship between the parameters and the effects of different parameter settings on the results. Finally, some problems to be solved in the convolution neural network and its application are given.
【作者单位】: 中国科学院苏州纳米技术与纳米仿生研究所;中国科学院大学;
【分类号】:TP183

【参考文献】

相关期刊论文 前7条

1 周飞燕;金林鹏;董军;;基于集成学习的室性早博识别方法[J];电子学报;2017年02期

2 常亮;邓小明;周明全;武仲科;袁野;杨硕;王宏安;;图像理解中的卷积神经网络[J];自动化学报;2016年09期

3 李红;刘芳;杨淑媛;张凯;;基于深度支撑值学习网络的遥感图像融合[J];计算机学报;2016年08期

4 高君宇;杨小汕;张天柱;徐常胜;;基于深度学习的鲁棒性视觉跟踪方法[J];计算机学报;2016年07期

5 金林鹏;董军;;面向临床心电图分析的深层学习算法[J];中国科学:信息科学;2015年03期

6 刘建伟;刘媛;罗雄麟;;玻尔兹曼机研究进展[J];计算机研究与发展;2014年01期

7 余凯;贾磊;陈雨强;徐伟;;深度学习的昨天、今天和明天[J];计算机研究与发展;2013年09期

相关博士学位论文 前1条

1 胡晓娟;中医脉诊信号感知与计算机辅助识别研究[D];华东师范大学;2013年

【共引文献】

相关期刊论文 前10条

1 涂中文;赵艳明;宋金宝;;基于自动编码器的语音音色客观评价[J];中国传媒大学学报(自然科学版);2017年04期

2 Linpeng JIN;Jun DONG;;Classification of normal and abnormal ECG records using lead convolutional neural network and rule inference[J];Science China(Information Sciences);2017年07期

3 黄寿喜;邱卫根;;基于改进的深度信念网络的人脸表情识别[J];计算机工程与设计;2017年06期

4 刘全;翟建伟;钟珊;章宗长;周倩;章鹏;;一种基于视觉注意力机制的深度循环Q网络模型[J];计算机学报;2017年06期

5 宋超;许道云;秦永彬;;分离多路卷积神经网络研究[J];计算机工程;2017年06期

6 史佳琪;张建华;;基于深度学习的超短期光伏精细化预测模型研究[J];电力建设;2017年06期

7 刘世蕾;崔晓明;聂茹;;DBM-ELM深层网络模型[J];南京大学学报(自然科学);2017年03期

8 顾亚风;叶学义;夏经文;夏胡云;;基于卷积神经网络的古玩图片分类方法[J];软件导刊;2017年05期

9 沈忠华;;新技术视域下的教育大数据与教育评估新探——兼论区块链技术对在线教育评估的影响[J];远程教育杂志;2017年03期

10 刘晨;曲长文;周强;李智;;一种卷积神经网络的优化方法[J];舰船电子工程;2017年05期

【二级参考文献】

相关期刊论文 前10条

1 王宇霞;赵清杰;蔡艺明;王博;;基于自重构粒子滤波算法的目标跟踪[J];计算机学报;2016年07期

2 余淼;胡占义;;高阶马尔科夫随机场及其在场景理解中的应用[J];自动化学报;2015年07期

3 金林鹏;董军;;面向临床心电图分析的深层学习算法[J];中国科学:信息科学;2015年03期

4 黄凯奇;陈晓棠;康运锋;谭铁牛;;智能视频监控技术综述[J];计算机学报;2015年06期

5 杨莹;吴诚炜;胡苏;;基于受限玻尔兹曼机的中文文档分类[J];科技创新导报;2012年16期

6 肖国强;康勤;江健民;张贝贝;;基于中心宏块的视频目标跟踪算法[J];计算机学报;2011年09期

7 杨向林;严洪;许志;任兆瑞;宋晋忠;姚宇华;李延军;;基于Hilbert-Huang变换的ECG消噪[J];电子学报;2011年04期

8 赵志宏;杨绍普;马增强;;基于卷积神经网络LeNet-5的车牌字符识别研究[J];系统仿真学报;2010年03期

9 云廷进;郭永彩;高潮;;基于粒子Mean Shift迁移的红外人体目标跟踪算法[J];计算机学报;2009年06期

10 黄福珍,苏剑波;基于Level Set方法的人脸轮廓提取与跟踪[J];计算机学报;2003年04期

相关博士学位论文 前2条

1 张嘉伟;心电图形态特征的识别及其在分类中的作用研究[D];华东师范大学;2011年

2 韩清鹏;脉搏信号的非线性分析及其不同情绪和环境的影响研究[D];浙江大学;2007年

【相似文献】

相关期刊论文 前10条

1 云中客;新的神经网络来自于仿生学[J];物理;2001年10期

2 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期

3 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期

4 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期

5 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期

6 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期

7 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期

8 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期

9 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期

10 杨钟瑾;;神经网络的过去、现在和将来[J];青年探索;2006年04期

相关会议论文 前10条

1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年

2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年

3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年

4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年

9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年

10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年

相关重要报纸文章 前10条

1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年

2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年

3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年

4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年

5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年

6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年

7 健康时报特约记者  张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年

8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年

9 ;神经网络和模糊逻辑[N];世界金属导报;2002年

10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年

相关博士学位论文 前10条

1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年

2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年

3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年

4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年

5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年

6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年

7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年

8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年

9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年

10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年

相关硕士学位论文 前10条

1 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年

2 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年

3 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年

4 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年

5 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年

6 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年

7 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年

8 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年

9 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年

10 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年



本文编号:1554525

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1554525.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a2880***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com