语音产生的神经生理控制建模
发布时间:2021-07-31 20:27
大脑对于语音产生的控制过程是非常复杂的,包括许多的神经控制过程如语音规划、听觉感知反馈和体感感知反馈等。在控制过程中,各个相关的脑区是协同和并行工作的,一个区域的控制信号会传输到另外几个区域,这其中包含着许多“一对多”的关系。然而,在之前的神经计算模型结构中,各区域状态之间的关系都是“一对一”的,并不是“一对多”的。因此,为了表现出一对多的控制关系,本文对模型的结构进行了修改,将模型中的运动规划状态、运动执行状态、体感状态和声学状态分别使用一个状态层来表示,并将每一层与脑区中的一个特定区域相对应。最后将训练结果分别用一个自组织图(Self-organizing Map,SOM)来表示。本文提出的神经计算模型使用了一种基于语音产生的生理计算模型。该生理模型作为神经计算模型的末梢语音产生模块是用来模拟人体发声时的声道状态的,它替代了过去大部分神经控制模型所使用的几何模型,这样可以更好地反映人体语音产生过程中的具体生理特征。本文使用神经计算模型对辅音-元音-(Consonant-vowel-,CV-)音节的动态特性进行了处理,设计了对于CV-音节的神经化映射方法并构造了数据量较大(25000...
【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
DIVA模型结构图
的神经激活模式)由前馈控制模块来运行。一个音节(在语音获取阶段已习或训练)的感知状态(听觉状态和体感状态)和运动规划状态会通过语Phonetic Map)来激活,语音图可以被理解为是一个通过中心神经映射方的字音表。对于每一个频繁出现的音节,音素图会为每一个音素状态创建定神经元的激活形式,并随后逐渐激活出两个感知状态和运动规划状态。频繁出现的音节,运动规划状态会在运动计划模块的亚音节单元级进行产例来说,一个音节的产生包括音节初始化、音节韵律产生和音节语音信号过程。在运动规划图级别上,每一个语音项目(当前语音项目)会激活一别的运动状态(运动规划),这个高级别的运动状态定义了语音动作或声单元的时间协调过程。一个语音项目的运动规划由运动执行模块来执行,了发声器官的具体运动过程,运动执行模块会计算出初始运动规划图级别的每一个语音动作过程。例如,对与关闭嘴唇这个动作包括一系列的协调动少包括放低下巴、上下移动嘴唇等动作。因此,这些发声器官必须通过协来完成一个具体的语音协同动作。发声器官的具体运动过程是通过神经控运动模块来控制各个发声器官执行的。
有人体具体的发声生理特征。所以为了更好地探究人体的语音发生过程控制过程,必须使用一种更贴近于人体,基于人体发音生理特征的生理来替代原有的几何模型。3 自组织图(Self-organizing map, SOM)算法.1 自组织图算法简介神经计算模型所使用的语音知识训练学习方法为自组织图算法。它最早兰赫尔辛基大学的 Kohonen T.教授提出[38]。他指出,在人的神经系统一个“侧抑制”现象,即:如果有一个神经元细胞产生兴奋之后,它会的其他神经元细胞产生一定的抑制作用,也就是说每个神经元细胞都会兴奋度最强的神经元细胞所影响而产生抑制作用。所以当一个神经网络同的输入模式后,神经网络中的各个区域根据不同的输入模式会产生出应状态[39]。
【参考文献】:
期刊论文
[1]Feedforward Control of a 3-D Physiological Articulatory Model for Vowel Production[J]. 方强,Akikazu Nishikido. Tsinghua Science and Technology. 2009(05)
本文编号:3314137
【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
DIVA模型结构图
的神经激活模式)由前馈控制模块来运行。一个音节(在语音获取阶段已习或训练)的感知状态(听觉状态和体感状态)和运动规划状态会通过语Phonetic Map)来激活,语音图可以被理解为是一个通过中心神经映射方的字音表。对于每一个频繁出现的音节,音素图会为每一个音素状态创建定神经元的激活形式,并随后逐渐激活出两个感知状态和运动规划状态。频繁出现的音节,运动规划状态会在运动计划模块的亚音节单元级进行产例来说,一个音节的产生包括音节初始化、音节韵律产生和音节语音信号过程。在运动规划图级别上,每一个语音项目(当前语音项目)会激活一别的运动状态(运动规划),这个高级别的运动状态定义了语音动作或声单元的时间协调过程。一个语音项目的运动规划由运动执行模块来执行,了发声器官的具体运动过程,运动执行模块会计算出初始运动规划图级别的每一个语音动作过程。例如,对与关闭嘴唇这个动作包括一系列的协调动少包括放低下巴、上下移动嘴唇等动作。因此,这些发声器官必须通过协来完成一个具体的语音协同动作。发声器官的具体运动过程是通过神经控运动模块来控制各个发声器官执行的。
有人体具体的发声生理特征。所以为了更好地探究人体的语音发生过程控制过程,必须使用一种更贴近于人体,基于人体发音生理特征的生理来替代原有的几何模型。3 自组织图(Self-organizing map, SOM)算法.1 自组织图算法简介神经计算模型所使用的语音知识训练学习方法为自组织图算法。它最早兰赫尔辛基大学的 Kohonen T.教授提出[38]。他指出,在人的神经系统一个“侧抑制”现象,即:如果有一个神经元细胞产生兴奋之后,它会的其他神经元细胞产生一定的抑制作用,也就是说每个神经元细胞都会兴奋度最强的神经元细胞所影响而产生抑制作用。所以当一个神经网络同的输入模式后,神经网络中的各个区域根据不同的输入模式会产生出应状态[39]。
【参考文献】:
期刊论文
[1]Feedforward Control of a 3-D Physiological Articulatory Model for Vowel Production[J]. 方强,Akikazu Nishikido. Tsinghua Science and Technology. 2009(05)
本文编号:3314137
本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/3314137.html
最近更新
教材专著