基于DIVA模型的汉语语音发音系统研究
发布时间:2017-04-26 20:08
本文关键词:基于DIVA模型的汉语语音发音系统研究,,由笔耕文化传播整理发布。
【摘要】:在神经解剖学和神经心理学层次上仿真和描述大脑中语音生成和理解相关区域的功能是近年来人工语音合成系统追求的主要目标。围绕这一目标,许多学者在语音神经网络计算模型的研究方面做出了巨大努力。其中最突出的是波士顿大学语音实验室的冈瑟教授(FrankH.Guenther)及其团队研究的DIVA(Directions Into Velocities of Articulators)模型。它是一种可以描述语音生成与获取相关的处理过程,并可以通过控制一个模拟声道生成单词、音节或音素的神经网络模型。但是,DIVA模型是以英文29个基本音素为研究背景,其在汉语语音研究过程中存在局限性。针对DIVA模型及汉语语音研究的特点,本文主要进行如下研究:首先,针对DIVA模型所采用的语音感兴趣区域是基于英语语音研究而制定的问题,本文对汉语语音加工过程进行功能磁共振成像实验研究,并基于DIVA模型对实验结果进行分析。这为完善DIVA模型,使其适用于汉语语音研究提供了可行的方案。其次,针对汉语神经分析系统研究中,非侵入式脑机接口采集到的脑电数据存在的分辨率低、干扰大的问题,本文提出了一种基于DIVA模型的脑电信号约束处理方法。使用模型模拟生成的功能性磁共振成像数据激活点的空间信息作为限制条件,对脑电信号进行分析定位。实验结果表明该处理方法可以对受试者的激活脑区进行精确定位。本文的研究为使用DIVA模型进行汉语语音研究提供了可行的方案和数据处理方法,实验过程中形成的影像数据集将对汉语语音相关研究提供重要的参考。
【关键词】:DIVA模型 脑-机接口 功能磁共振成像 感兴趣区域 脑电信号
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R338;TN912.3
【目录】:
- 摘要4-5
- Abstrad5-8
- 专用术语注释表8-10
- 第一章 绪论10-17
- 1.1 研究动机10-11
- 1.2 国内外研究现状11-15
- 1.2.1 DIVA模型的研究现状11-13
- 1.2.2 汉语语音相关感兴趣区域研究13-14
- 1.2.3 脑电信号融合处理14-15
- 1.3 研究内容15-16
- 1.4 论文架构16-17
- 第二章 脑-计算机接口系统17-26
- 2.1 脑-计算机接口简介17-20
- 2.1.1 功能模块17-18
- 2.1.2 脑传感器18-19
- 2.1.3 BCI算法19
- 2.1.4 研究现状19-20
- 2.2 脑电信号20-23
- 2.2.1 脑电信号分类21-22
- 2.2.2 脑电信号的频率22-23
- 2.3 语音神经分析系统中的BCI应用23-25
- 2.4 本章小结25-26
- 第三章 语音研究中的神经网络建模26-37
- 3.1 语音研究中的神经网络建模26-27
- 3.2 DIVA模型结构27-30
- 3.2.1 DIVA模型的语音控制方案27-28
- 3.2.2 前馈控制子系统28
- 3.2.3 反馈控制子系统28-30
- 3.3 生成模拟的fMRI数据30-31
- 3.4 大脑活动分析方法31-34
- 3.4.1 基于体素的分析31-32
- 3.4.2 基于感兴趣区域的分析32-33
- 3.4.3 有效连通性分析33-34
- 3.5 计算神经网络模型的改进34-35
- 3.6 本章小结35-37
- 第四章 基于DIVA模型的汉语语音感兴趣区域研究37-45
- 4.1 语音研究中的感兴趣区域分析的研究37-40
- 4.1.1 语音相关大脑感兴趣区域37-39
- 4.1.2 实验设计方案39-40
- 4.2 数据分析方案40-41
- 4.2.1 核磁共振成像实验40
- 4.2.2 受试者及实验材料40-41
- 4.3 具体实验方法41-42
- 4.3.1 数据处理方案41
- 4.3.2 实验结果41-42
- 4.4 基于DIVA模型的实验结果解释分析42-44
- 4.4.1 左侧额下回42-43
- 4.4.2 枕叶43
- 4.4.3 左侧额下回43
- 4.4.4 双侧侧颞下回与缘上回43
- 4.4.5 双侧小脑43-44
- 4.5 本章小结44-45
- 第五章 基于DIVA模型的脑电信号处理方法研究45-54
- 5.1 EEG/fMRI融合分析技术45-48
- 5.1.1 球脑模型45
- 5.1.2 EEG正向问题45-46
- 5.1.3 EEG逆向问题46-47
- 5.1.4 ICA在EEG数据处理中的应用47-48
- 5.2 EEG数据采集48-51
- 5.2.1 受试者及实验材料48
- 5.2.2 具体试验方法48-49
- 5.2.3 数据采集49-50
- 5.2.4 数据去噪50-51
- 5.3 fMRI数据采集51-52
- 5.4 脑电信号融合分析52-53
- 5.5 本章小结53-54
- 第六章 总结与展望54-56
- 6.1 结论54
- 6.2 展望54-56
- 参考文献56-59
- 附录1 程序清单59-60
- 附录2 攻读硕士学位期间撰写的论文60-61
- 附录3 攻读硕士学位期间申请的专利61-62
- 附录4 攻读硕士学位期间参加的科研项目62-63
- 致谢63
【相似文献】
中国期刊全文数据库 前2条
1 高慧,苏广川,陈善广;不同情绪状态下汉语语音的声学特征分析[J];航天医学与医学工程;2005年05期
2 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 李树青;方棣棠;卿山;;一个大型的汉语语音数据库[A];第四届全国人机语音通讯学术会议论文集[C];1996年
2 陶超;徐歆;杜功焕;朱哲民;;混沌滴定方法对汉语语音四声混沌特性的研究[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
3 方棣棠;李树青;;现代汉语语音学与言语工程[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
4 周s
本文编号:329133
本文链接:https://www.wllwen.com/xiyixuelunwen/329133.html
最近更新
教材专著