当前位置:主页 > 医学论文 > 实验医学论文 >

基于DIVA神经网络模型模拟语音感知的神经机制研究

发布时间:2017-08-03 16:29

  本文关键词:基于DIVA神经网络模型模拟语音感知的神经机制研究


  更多相关文章: 语音感知 神经网络 自组织映射 听觉感知 感知磁效应


【摘要】:我们通过研究心理语言学实验结果得知“感知磁效应”(perceptual magneteffect)是影响婴幼儿语音发展的重要因素之一,这种效应会造成听觉感知空间的扭曲,使一个音位(phoneme)周围的声音都会被归为同一类。本研究的目的是运用人工神经网络建立一种能模拟语音感知(speech perception)、语音获取(speechacquisition)和语音生成的模型,,并以人工神经网络的非监督式学习(unsupervisedlearning)方式让模型能从语音的共振峰中找出音位的语音分类(phoneticcategory),来模拟人类从听觉上获取语音的过程。 本文通过改进自组织映射(Self-Organizing Map,SOM)算法和比较心理语音学实验的结果,让模型呈现英文发音的听觉感知空间。从模拟结果显示模型能辨认英文辅音/r/与/l/、典型音与非典型音的差异以及形成元音的听觉感知空间。本文通过模拟语音感知及结合具有语音生成能力的神经网络模型(Directions IntoVelocities ofArticulators,DIVA模型),呈现人类获得发音能力的过程。 目前除了让修改后的DIVA模型能学习英文元音以外,更进一步的推广至中文元音发音。未来将继续发展本论文研究的模型,希望能用于探讨大脑与语音之间的关系,借此衍生至临床上医学的应用。
【关键词】:语音感知 神经网络 自组织映射 听觉感知 感知磁效应
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:R338;TN912.3
【目录】:
  • 摘要4-5
  • Abstract5-8
  • 专用术语注释表8-9
  • 第1章 绪论9-20
  • 1.1 研究动机9-10
  • 1.2 语音的感知10-12
  • 1.2.1 语音的声学特征10-11
  • 1.2.2 语音的感知实验11-12
  • 1.3 文献探讨12-18
  • 1.3.1 听觉感知研究的回顾12-15
  • 1.3.2 语音的感知模型回顾15-16
  • 1.3.3 DIVA 模型16-18
  • 1.4 研究目的18
  • 1.5 论文架构18-20
  • 第2章 神经网络基本理论20-29
  • 2.1 神经网络的简介20-22
  • 2.1.1 神经元模型20-21
  • 2.1.2 神经网络架构21-22
  • 2.1.3 神经网络的类型22
  • 2.2 学习机制22-25
  • 2.2.1 监督式学习22-23
  • 2.2.2 非监督式学习23-25
  • 2.3 自组织特征映射网络25-27
  • 2.4 模式识别27-28
  • 2.5 本章小结28-29
  • 第3章 语音感知模型29-38
  • 3.1 语音的感知模型29-33
  • 3.1.1 模型架构29
  • 3.1.2 共振峰的表示29-30
  • 3.1.3 听觉映射集30-31
  • 3.1.4 群向量(population vector)31
  • 3.1.5 听觉感知模型结合 SOM 网络的运用31-32
  • 3.1.6 语音的产生32-33
  • 3.2 DIVA 模型33-37
  • 3.2.1 DIVA 模型的发音流程34
  • 3.2.2 语音映射集(Speech Sound Map)34-35
  • 3.2.3 体觉方向向量(Orosensory Direction Vector)35-36
  • 3.2.4 发音器官的运动向量(Articulator Velocity Vector)36-37
  • 3.2.5 听觉反馈系统37
  • 3.2.6 语音处理程序37
  • 3.3 本章小结37-38
  • 第4章 实验与方法38-48
  • 4.1 实验方法38-39
  • 4.2 模拟实验39-43
  • 4.2.1 英文辅音/r/和/l/的辨认39-41
  • 4.2.2 典型音与非典型音的实验41-42
  • 4.2.3 训练听觉感知空间42-43
  • 4.3 利用 DIVA 模型模拟语音感知43-47
  • 4.3.1 DIVA 模型的接口43-46
  • 4.3.2 增加听觉感知至 DIVA 模型46-47
  • 4.4 本章小结47-48
  • 第5章 结果与讨论48-64
  • 5.1 模拟结果48-53
  • 5.1.1 英文辅音/r/-/l/的辨认48-51
  • 5.1.2 典型音与非典型音的辨认差异51-52
  • 5.1.3 听觉感知空间的训练52-53
  • 5.2 DIVA 模型的听觉感知空间53-63
  • 5.2.1 语音感知与语音产生54-56
  • 5.2.2 语音感知与语音产生间的关系56-59
  • 5.2.3 语音感知的衍生讨论——汉语元音59-61
  • 5.2.4 利用实际人声训练中文元音61-63
  • 5.3 语音感知模型与神经生理学上的关系63-64
  • 第6章 结论与展望64-66
  • 6.1 结论64
  • 6.2 展望64-66
  • 参考文献66-69
  • 附录 1 程序清单69-70
  • 附录 2 攻读硕士学位期间撰写的论文70-71
  • 附录 3 攻读硕士学位期间申请的专利71-72
  • 附录 4 攻读硕士学位期间参加的科研项目72-73
  • 致谢73

【参考文献】

中国期刊全文数据库 前3条

1 杨占华;杨燕;;SOM神经网络算法的研究与进展[J];计算机工程;2006年16期

2 周勇;胡中功;;RBF神经网络理论及其在控制中的应用[J];武汉科技学院学报;2007年05期

3 杨盛春;贾林祥;;神经网络内监督学习和无监督学习之比较[J];徐州建筑职业技术学院学报;2006年03期



本文编号:615293

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/615293.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b3bdd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com