互学习神经网络训练方法研究
本文关键词: 神经网络 互学习 权值共享 BP算法 双向认知 分类识别 人工智能 出处:《计算机学报》2017年06期 论文类型:期刊论文
【摘要】:由于BP神经网络具有表达能力强,模型简单等特点,经过近30年的发展,在理论和应用研究上都取得了巨大的进步,然而容易陷入局部最优和泛化能力差等问题却限制了神经网络的发展.同时,大数据的出现和深度学习算法的提出与应用,为神经网络向更类脑的方向发展提出了新的要求.针对上述问题,该文从模拟生物双向认知能力的角度出发,构造了一种新的神经网络模型——互学习神经网络模型,该模型在标准正向神经网络的基础上,引入了与其具有结构对称性的负向神经网络,利用正、负向神经网络分别模拟生物的顺向和逆向认知过程,并在此基础上提出了一种新的神经网络训练方法——互学习神经网络训练方法,该方法通过网络连接权值转置共享,正、负双向交替训练的方式对互学习神经网络模型进行训练,从而实现输入数据和输出标签之间的相互学习,使网络具有双向认知能力.实验表明,互学习神经网络训练方法可以同时训练正、负两个神经网络,并使网络收敛.同时,在此基础上提出了"互学习预训练+标准正向训练"的两阶段学习策略和相应的转换学习方法,这种转换学习方法起到了和"无监督预训练+监督微调"相同的效果,能够使网络训练效果更好,是一种快速、稳定、泛化能力强的新型神经网络学习方法.
[Abstract]:Because BP neural network has the characteristics of strong expression ability and simple model, after nearly 30 years' development, it has made great progress in theory and application research. However, problems such as local optimization and poor generalization ability limit the development of neural networks. At the same time, the emergence of big data and the introduction and application of depth learning algorithm, This paper puts forward new requirements for the development of neural network towards more brain-like. In view of the above problems, a new neural network model-mutual learning neural network model is constructed from the point of view of simulating biologic bidirectional cognitive ability. Based on the standard forward neural network, a negative neural network with structural symmetry is introduced in this model. The forward and negative neural networks are used to simulate the forward and reverse cognitive processes of organisms, respectively. On the basis of this, a new neural network training method-mutual learning neural network training method is proposed. This method trains the model of mutual learning neural network by transposition of network connection weights, positive and negative two-way alternate training. The experiment shows that the training method of mutual learning neural network can train both positive and negative neural networks at the same time, and make the network converge. On the basis of this, the two-stage learning strategy and the corresponding conversion learning method of "mutual learning pre-training standard forward training" are put forward. This conversion learning method has the same effect as "unsupervised pre-training supervision fine-tuning". It is a new learning method of neural network with fast, stable and strong generalization ability.
【作者单位】: 辽宁工程技术大学数学与系统科学研究所;辽宁工程技术大学智能工程与数学研究院;辽宁工程技术大学矿业学院;
【基金】:国家自然科学基金(51304114,71371091)资助~~
【分类号】:TP18
【参考文献】
相关期刊论文 前4条
1 焦李成;杨淑媛;刘芳;王士刚;冯志玺;;神经网络七十年:回顾与展望[J];计算机学报;2016年08期
2 刘建伟;刘媛;罗雄麟;;深度学习研究进展[J];计算机应用研究;2014年07期
3 邓万宇;郑庆华;陈琳;许学斌;;神经网络极速学习方法研究[J];计算机学报;2010年02期
4 汪培庄,张大志;思维的数学形式初探[J];高校应用数学学报A辑(中文版);1986年01期
【共引文献】
相关期刊论文 前10条
1 张雪英;张乐;孙颖;张卫;;基于KELM决策融合的语音情感识别[J];电子技术应用;2017年08期
2 安杏杏;董宏丽;张勇;邵晓光;代丽艳;;输油管道泄漏检测技术综述[J];吉林大学学报(信息科学版);2017年04期
3 梁洪卫;张旭;邹岱峰;;基于VMD-BP神经网络模型的天然气管道工况检测研究[J];化工自动化及仪表;2017年07期
4 孙凡;李会艳;赵爱清;;多FPGA神经元网络仿真平台设计[J];天津职业技术师范大学学报;2017年02期
5 胡正平;陈俊岭;王蒙;孙哲;;深层融合度量子空间学习稀疏特征提取算法[J];信号处理;2017年06期
6 覃科;刘晓刚;丁立新;;基于卷积神经网络的CO_2焊接熔池图像状态识别方法[J];焊接;2017年06期
7 邓凝旖;沈志强;郭跃飞;;基于类别先验与深度神经网络特征的显著性检测[J];计算机工程;2017年06期
8 宋汉强;李本威;张峗;蒋科艺;;基于聚类与粒子群极限学习机的航空发动机推力估计器设计[J];推进技术;2017年06期
9 余伟豪;李忠;安建琴;宋奕瑶;;深度学习框架和加速技术探讨[J];软件;2017年06期
10 万子平;马丽莎;李星宇;刘小旭;龙哲;;BP神经网络的内场驾考电子教练系统设计[J];单片机与嵌入式系统应用;2017年06期
【二级参考文献】
相关期刊论文 前7条
1 王守觉;曹文明;;半导体神经计算机的硬件实现及其在连续语音识别中的应用[J];电子学报;2006年02期
2 王守觉;仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论与应用[J];电子学报;2002年10期
3 王海龙,戚飞虎,任庆生;协同神经网络中参数的优化[J];红外与毫米波学报;2001年03期
4 赵同,戚飞虎,冯炯;协同式神经网络的识别性能分析[J];电子学报;2000年01期
5 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
6 陈国良,熊焰,方祥;通用并行神经网络模拟系统GP~2N~2S~2[J];小型微型计算机系统;1992年12期
7 陈国良,宋松纯,秦小鸥;主从通用神经网络模型[J];电子学报;1992年10期
【相似文献】
相关期刊论文 前10条
1 李运锋,袁景淇,薛耀锋;发酵过程中神经网络训练样本的选取[J];化工自动化及仪表;2004年06期
2 肖红;曹茂俊;李盼池;王海英;;基于分段线性插值的过程神经网络训练[J];计算机工程;2011年20期
3 史志科;非线性规划U—D分解方法及其在神经网络训练中的应用[J];自动化学报;1995年06期
4 吴军,徐松源,王常虹;神经网络训练的一种随机方法[J];黑龙江自动化技术与应用;1997年03期
5 金涛斌,王安国,丁荣林,吴咏诗;周期性缺陷接地结构神经网络训练样本预处理[J];固体电子学研究与进展;2005年03期
6 胡纪五,王卫东;带有惯性附加项的神经网络训练方的研究[J];计算技术与自动化;1999年02期
7 郝红卫;蒋蓉蓉;;基于最近邻规则的神经网络训练样本选择方法[J];自动化学报;2007年12期
8 王艳峰;张健;吴燕红;;一种优选神经网络训练样本的混合聚类算法[J];辽宁工业大学学报(自然科学版);2010年06期
9 周福章,朱坚民;神经网络训练参数等对控制效果的影响[J];洛阳工学院学报;1996年01期
10 徐乐华;凌卫新;熊丽琼;;基于面向对象自适应粒子群算法的神经网络训练[J];计算机应用研究;2009年01期
相关会议论文 前3条
1 张应博;;神经网络训练中的迭代扩展卡尔曼粒子滤波算法[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
2 姜晓军;程卫东;;神经网络训练样本选取与优化的研究[A];第十七届全国测控计量仪器仪表学术年会(MCMI'2007)论文集(下册)[C];2007年
3 张应博;秦钟;王法胜;;神经网络训练中的粒子滤波算法[A];第二十九届中国控制会议论文集[C];2010年
相关硕士学位论文 前1条
1 林珲;微波器件智能建模中神经网络训练数据获取算法研究[D];天津大学;2014年
,本文编号:1508564
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1508564.html