深度神经网络音素识别系统及其隐藏层研究
本文选题:深度神经网络 切入点:语音识别 出处:《天津大学》2014年硕士论文 论文类型:学位论文
【摘要】:经过近半个世纪的积累和酝酿,语音识别技术在最近几年达到了大规模商业应用水平。而最近五年来,深度神经网络(Deep Neural Network,DNN)的出现给语音识别带来了新的突破。尽管深度神经网络在语音领域取得了巨大的成功,但其内在的机制及原理目前仍不清楚。本研究通过初步探索深度神经网络的隐藏层的功能与作用来研究这一问题,探索深度神经网络隐藏层与语音生成感知机理(音素的发音位置)之间的关系。本工作首先分别构建了汉语、英语、日语三种语言的深度神经网络音素识别系统,为了后续实验有可对比性,三个网络的结构配置均相同,采用目前同用的7层,2048节点/层的结构。根据数据库的可靠程度,选取英语和日语的深度神经网络进行隐藏层研究。由于神经网络的某一隐藏层无法被单独研究,所以本研究采用去掉一层或替换一层的方法,通过识别结果的变化,来反推被去层或被换层的作用。我们分别对英语和日语进行了去层实验,并用日语网络隐藏层对应替换英语隐藏层进行了换层实验。从分析结果可以看出,神经网络的不同隐藏层主要负责的音素可以大致按照发音位置进行分类:较低层主要负责后元音,较高层主要负责前元音;神经网络的第二层对发音约束位置靠前的辅音更敏感,而其余的辅音更依赖中间层。换层实验说明上述结论在不同的语言间存在共通性。本工作作为对深度神经网络隐藏层的初步研究,只是作了简单的定性分析,在同类领域中,本研究提出一种新颖的方法来分析神经网络的隐藏层,第一次将研究重点放在深度神经网络的每一隐藏层上;第一次将人的发音机理加入深度神经网络,并通过实验方法探索两者间的关系。要想探究DNN表征机制,其内部隐藏层的功能,还需要未来的进一步研究。
[Abstract]:After nearly half a century of accumulation and brewing, speech recognition technology has reached the level of large-scale commercial applications in recent years. The emergence of Deep Neural Network (DNN) has brought a new breakthrough in speech recognition, despite the tremendous success of the Deep Neural Network in the field of speech. However, its intrinsic mechanism and mechanism are still not clear. This study studies this problem by exploring the function and function of the hidden layer of the deep neural network. This paper explores the relationship between the hidden layer of depth neural network and the mechanism of phoneme perception (phoneme pronunciation location). Firstly, a depth neural network phoneme recognition system for Chinese, English and Japanese is constructed, which is composed of three languages: Chinese, English and Japanese. In order to be comparable in subsequent experiments, the three networks have the same configuration, using the same 7-layer 2048 node / layer structure, according to the reliability of the database. Since a certain hidden layer of neural network can not be studied separately, the method of removing one layer or replacing one layer is adopted to identify the change of the result. We have carried out delamination experiments on English and Japanese, and replaced English hidden layers with Japanese network hidden layers. From the results of the analysis, we can see that, The phonemes of different hidden layers of neural network can be classified according to the pronunciation position: the lower level is mainly responsible for the post vowel, the higher level is mainly responsible for the front vowel; The second layer of the neural network is more sensitive to the consonant in the front of the articulation constraint. The rest of the consonants depend more on the middle layer. The experiment of changing layers shows that the above conclusions are common among different languages. As a preliminary study of the hidden layer of deep neural networks, this work has only made a simple qualitative analysis in the same field. In this study, a novel method is proposed to analyze the hidden layer of neural network, which is focused on each hidden layer of the deep neural network for the first time, and the mechanism of human pronunciation is added to the deep neural network for the first time. In order to explore the mechanism of DNN representation, the function of the inner hidden layer still needs further study in the future.
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP183;TN912.34
【相似文献】
相关期刊论文 前10条
1 云中客;新的神经网络来自于仿生学[J];物理;2001年10期
2 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期
3 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期
4 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期
5 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期
6 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期
7 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期
8 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期
9 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期
10 杨钟瑾;;神经网络的过去、现在和将来[J];青年探索;2006年04期
相关会议论文 前10条
1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年
2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年
3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年
9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
相关重要报纸文章 前10条
1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年
2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年
3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年
4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年
5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年
6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年
7 健康时报特约记者 张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年
8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年
9 ;神经网络和模糊逻辑[N];世界金属导报;2002年
10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年
相关博士学位论文 前10条
1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年
3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年
4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年
5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年
6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年
7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年
8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年
9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年
10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年
相关硕士学位论文 前10条
1 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年
2 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年
3 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年
4 胡婷;改进QGA-BP模型及其在弥苴河总氮量预测中的应用[D];昆明理工大学;2015年
5 刘俊辉;基于数据清洗方法的河道水位预测研究[D];昆明理工大学;2015年
6 刘波;短期风电功率预测方法研究[D];南京信息工程大学;2015年
7 蔡邦宇;人脸识别中单次ERP时空特征分析及其快速检索的应用[D];浙江大学;2015年
8 郑川;垃圾评论检测算法的研究[D];西南交通大学;2015年
9 李菊;BP神经网络在房地产批量评估中的应用研究[D];昆明理工大学;2015年
10 马亮;降水点分类预测方法研究[D];中国地质大学(北京);2015年
,本文编号:1576887
本文链接:https://www.wllwen.com/kejilunwen/wltx/1576887.html