语音经验调节嗓音辨别的认知神经机制
发布时间:2020-08-13 17:42
【摘要】:人类的嗓音携带了大量的社会信息,因此嗓音辨别在人际交流和社会互动中具有重要的社会意义。嗓音辨别是个体基于基本的听觉参数来判断两个嗓音相同与否的能力。在嗓音辨别过程中,个体需排除无关信息干扰并对不同的嗓音刺激进行匹配、比较,然后判断是否源于同一发声源。作为基于嗓音加工的一种认知活动,通常会受到语言熟悉性(语音经验)的影响,即听者加工其熟悉语言嗓音的能力胜于加工不熟悉语言嗓音的能力。这种现象自提出以来,在双语、婴幼儿、嗓音失认症及阅读障碍等正常和临床群体中得到了大量验证。研究者们多侧重于对该认知现象的重复验证,并且普遍认为嗓音辨别是一种依赖于低阶特定嗓音声学特征的认知加工。因此,语言经验影响嗓音辨别的内在认知神经机制尚不清楚,例如语言经验如何体现出其对嗓音辨别的影响,该认知过程中是否存在高阶认知功能等。鉴于此,本研究将借助行为、功能磁共振成像(fMRI)和无创脑刺激技术(高精度经颅直流电刺激,HD-tDCS)等来探讨语音经验调节嗓音辨别的认知神经机制。本研究采用时间反转技术排除实验语音材料的语义信息并使其不可理解,从而只探讨语音经验在嗓音辨别中的作用。首先采用行为和fMRI技术来探讨语言熟悉性梯度变化对嗓音辨别影响的认知神经机制,然后采用行为和无创脑刺激技术来揭示嗓音声学信息的复杂度对说话人辨别的影响、认知控制能力与语音经验在嗓音辨别中的相互关系,最后采用fMRI技术来论证以颞叶听觉皮层为主大脑如何表征语音经验。基于已有研究认为即使相同内容由不同人说也会引起听者在其知觉模式上的差异,为此研究一采用行为和fMRI技术探讨在低声学复杂度情况下,语言熟悉性梯度变化对嗓音辨别影响的认知神经机制。研究一共包含两个实验。实验一探讨了语言经验在同一句话是否源于同一说话人(低声学复杂度)情境下对嗓音辨别的影响。结果发现,听者的嗓音辨别能力在说话人变异时差于说话人不变异的情况,表现为反应时延长和敏感力偏低,但均存在语言熟悉性效应,尤其是第二语言和陌生语言间同样存在这种语言熟悉性效应。实验二则采用fMRI技术进一步探讨了其内在神经机制。结果发现,大脑在嗓音和控制有关的脑区(如前扣带回、脑岛等)也得到了激活。更为重要地是,语音经验调节多个大尺度脑网络间的耦合,具体表现为从额顶网络到嗓音识别网络、默认网络到嗓音识别网络的有向功能连接作为两个主要的神经通道,从而实现了基于语音经验的认知控制在嗓音辨别中的作用。研究二(实验三)在研究一的基础上,进一步考察了同一句话由相同或不同人说、不同两句话由相同或不同人说所产生的高声学复杂度嗓音对语音经验调节嗓音辨别的影响。由于同一个或不同两个说话人说不同两句话则产生了较高地说话人变异和嗓音内容变异,这些变异形成的无关信息或干扰信息则会对听者嗓音辨别加工产生干扰。因此研究二结果发现,无论说话人和嗓音内容是否变异,均存在语言熟悉性效应,但说话人和嗓音内容的变异则显著影响了听者的嗓音辨别能力。基于研究二发现声学信息越复杂,则产生的干扰信息则会越多,并进而影响听者的嗓音辨别能力。因此研究三从无创脑刺激技术的角度出发,通过对听者右侧背外侧前额叶脑区进行训练干预从而提高听者对干扰信息加工及嗓音辨别的能力。因此研究三(实验四)基于前后测及行为指标来探讨该认知控制脑区与语音经验调节嗓音辨别间的因果关系。分析发现,在反应时和辨别力指数上均存在语言经验的差异,但是阳极刺激和假刺激间则不存在差异。对后测与前测之间的差值按Block顺序分析则发现,阳极刺激的反应时差值比假刺激偏低,但在正确率上没有明显的差异。也就是说,虽然HD-tDCS的干预效果并不明显,但右侧背外侧前额叶脑区在阳极刺激干预下能提高个体的反应速度。换句话说,该脑区参与语音经验对嗓音辨别的调控,但不影响语音经验。因此,本研究推测认为听者的语音经验调节其认知控制功能来参与嗓音辨别。为进一步验证认知控制与语音经验二者在嗓音辨别中的作用关系,结合研究二的实验设计,研究四(实验五)采用了高低听觉Stroop任务对听者进行高低认知控制能力分组,以此来探讨认知控制能力对语音经验调节嗓音辨别的影响。结果发现,认知控制能力的高低对个体嗓音辨别的行为表现有着直接的影响,认知控制能力高的个体比能力低的个体更能正确有效地进行判断。此外,本研究则发现听者的认知控制功能参与了嗓音辨别,但受到语音经验的调节。鉴于前四个研究均表明语音经验在嗓音辨别中非常重要,为考察大脑到底是如何表征语音经验的,尤其是包含颞叶嗓音加工脑区在内的颞叶听觉脑区能否表征语音经验间的差异,研究五将通过实验六和实验七来展开探索。实验六采用了被动嗓音知觉任务,让被试在MRI中被动知觉三种不同熟悉度的语音(时间反转排除语义信息)且不做任何反应。结果发现听者大脑不表征无语义信息下的语音经验差异。实验七则在实验六的基础上增加了有语义信息的语音材料,然后对有、无语义信息情况下大脑表征模式进行差异分析。结果发现双侧前部颞中回,右侧后部颞中回,右侧缘上回及角回存在显著的激活。此外基于颞叶听觉脑区的神经信号分析,同样发现左后侧颞叶嗓音加工区、右侧前部和中部颞叶嗓音加工区能表征语言经验与语音类型间的差异。具体地说,颞叶嗓音加工脑区等颞叶听觉脑区不表征无语义刺激材料的语音经验,但在颞横回和右侧颞叶嗓音加工脑区却存在语言熟悉性梯度变化的趋势;而在语音含有语义信息时,以左侧颞叶嗓音加工为主的脑区能显著表征语音经验的差异。本研究通过行为、fMRI和HD-tDCS等技术揭示了语音经验调节嗓音辨别的认知神经机制,即个体仅基于其对语言声学结构的熟悉性就可以实现嗓音辨别,并在嗓音辨别依赖于低阶声学特征编码的传统观点基础上发现了认知控制等高阶认知功能同样参与嗓音辨别。认知控制能力高的个体更容易实现嗓音辨别,能力低的个体则影响其嗓音有效地辨别。但无论个体认知控制能力高低,均受到其自身语音经验的调节。作为语言熟悉性的功能,语音经验偏向于额顶网络的认知调控和默认网络的信息编码及检索,从而实现嗓音识别。但对于大脑对语音经验的表征模式而言,以颞叶嗓音加工区为主的颞叶听觉脑区不表征无语义信息语音间的经验差异,但能响应含语义信息且熟悉语言的语音,并表征其与其它语言间的经验差异。总之而言,本研究不仅首次揭示语言经验调节嗓音辨别的脑网络机制,也突出了认知控制等高阶认知功能在该过程中的意义,更强化了语音经验的重要性。因此这对我们后期深入开展有关研究或临床运用都提供了一定的理论证据和借鉴意义。
【学位授予单位】:西南大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:B842
【图文】:
喉部的肌肉会调整声带的长度和张力来对音高(Pitch)和音调(Tone)进行微调下来喉部以上的声道(Vocal Tract)(包括咽部、口腔和鼻腔)会对声带震动产生的声能塑性或过滤,并最终形成我们所听到的声音。此外,声带震动方式的改变,或者通过舌、软腭和嘴唇等动作可以改变声道的构型,从而改变声音的产生。发音器官对说话人识别其主要作用的区域是声带和声道长度(Vocal Tract Length, VT见图 1-1 B)。其中声带振动发声,其震动频率则称为声门脉冲率(Glottal Pulse Rate, GPR)门脉冲率则决定了说话人嗓音的基本频率(Fundamental Frequency,F0)和被感知到的;而声道长度则影响共振峰在频谱包络中的位置以及被感知到的音色(Timbre)(Mathiaon Kriegstein, 2014)。因此人类嗓音的交际功能主要建立在基本频率和共振峰这两个主要学成分上 (Mathias & von Kriegstein, 2014; Pisanski, Cartei, McGettigan, Raine, & Re016)。需要指出的是,男性声带长度范围是 17mm ~ 25mm,女性的则为 12.5mm ~ 17.5mThurman & Welch, 2000);而对应的男性平均 F0(声带每秒打开和闭合 115 次)为 115H性则为 220Hz (Baken & Orlikoff, 1999; Kreiman & Sidtis, 2011),而这就是男女性别在嗓音上差异的生理基础。
成为识别该说话人身份、性别和年龄等较好的指标 (Kreiman & Sidtis, 2011),即区别于人的参考指标。1.2.1 嗓音生成的神经基础除了在喉部等为主的发音生理系统外,也涉及到人脑神经系统参与到嗓音的生成。人声过程中重要的器官,如喉部和发音器官(如唇、舌、下颚等)在额叶的中央前回均有的脑区(见图 1-2A)(Simonyan, 2014)。其中最为重要的应属喉部运动皮层(Laryngeal Mortex, LMC),该区域由 Penfield 和 Boldrey (1937)在病患的临床研究中发现,并被定位在(vocalization)区域(见图 1-2B)。人脑中存在从 LMC 的单突触有向投射到位于脑干喉动神经元(laryngeal motoneuron)中的疑核(NucleusAmbiguus,Amb),并最终投射到人喉部肌肉 (Belyk & Brown, 2017; Kuypers, 1958; Simonyan, 2014)(见图 1-3A)。这种有向的存在则证明了在人类(非猴子)LMC 刺激诱发发音的重要性,也得到了众多关于有效意识状态下发声控制研究的支持 (Fitch, 2011; Fitch, Huber, & Bugnyar, 2010; Simonyaorwitz, 2011)。在生理学方面,这种人类有向单突触通路促进了疑核对说话和唱歌中复杂意学习的喉部动作的控制能力 (Penfield & Boldrey, 1937; Simonyan & Jürgens, 2003)。
西南大学博士学位论文 Rendall, 2011)。第一条通路则是与习得发音行为的嗓音生成(如语音)有关,需要意志,因此包含初级运动皮层(Primary Motor Cortex)、腹外侧和脑岛部分的额叶,然后连接质下区域,如网状结构(Reticular Formation, RF)、脑桥回(Pontine Grey)和发声运动元(Phonatory Motor Neuron)(位于疑核);而另外一条通路则是固有的且自发的嗓音生路,如非言语的情绪性发声 (Ackermann et al., 2014),该通路从前扣带回(Anterior Cinguortex, ACC)经由导水管周围灰质(Periaqueductal Grey, PAG)及邻近的腹侧被盖(Vengmentum)到网状结构和脑桥回,最终投射到发声运动神经元。因此双通路模型从大脑层面提供了发声行为的两种类型,也对嗓音生成的理解提供了很好的理论基础。
本文编号:2792310
【学位授予单位】:西南大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:B842
【图文】:
喉部的肌肉会调整声带的长度和张力来对音高(Pitch)和音调(Tone)进行微调下来喉部以上的声道(Vocal Tract)(包括咽部、口腔和鼻腔)会对声带震动产生的声能塑性或过滤,并最终形成我们所听到的声音。此外,声带震动方式的改变,或者通过舌、软腭和嘴唇等动作可以改变声道的构型,从而改变声音的产生。发音器官对说话人识别其主要作用的区域是声带和声道长度(Vocal Tract Length, VT见图 1-1 B)。其中声带振动发声,其震动频率则称为声门脉冲率(Glottal Pulse Rate, GPR)门脉冲率则决定了说话人嗓音的基本频率(Fundamental Frequency,F0)和被感知到的;而声道长度则影响共振峰在频谱包络中的位置以及被感知到的音色(Timbre)(Mathiaon Kriegstein, 2014)。因此人类嗓音的交际功能主要建立在基本频率和共振峰这两个主要学成分上 (Mathias & von Kriegstein, 2014; Pisanski, Cartei, McGettigan, Raine, & Re016)。需要指出的是,男性声带长度范围是 17mm ~ 25mm,女性的则为 12.5mm ~ 17.5mThurman & Welch, 2000);而对应的男性平均 F0(声带每秒打开和闭合 115 次)为 115H性则为 220Hz (Baken & Orlikoff, 1999; Kreiman & Sidtis, 2011),而这就是男女性别在嗓音上差异的生理基础。
成为识别该说话人身份、性别和年龄等较好的指标 (Kreiman & Sidtis, 2011),即区别于人的参考指标。1.2.1 嗓音生成的神经基础除了在喉部等为主的发音生理系统外,也涉及到人脑神经系统参与到嗓音的生成。人声过程中重要的器官,如喉部和发音器官(如唇、舌、下颚等)在额叶的中央前回均有的脑区(见图 1-2A)(Simonyan, 2014)。其中最为重要的应属喉部运动皮层(Laryngeal Mortex, LMC),该区域由 Penfield 和 Boldrey (1937)在病患的临床研究中发现,并被定位在(vocalization)区域(见图 1-2B)。人脑中存在从 LMC 的单突触有向投射到位于脑干喉动神经元(laryngeal motoneuron)中的疑核(NucleusAmbiguus,Amb),并最终投射到人喉部肌肉 (Belyk & Brown, 2017; Kuypers, 1958; Simonyan, 2014)(见图 1-3A)。这种有向的存在则证明了在人类(非猴子)LMC 刺激诱发发音的重要性,也得到了众多关于有效意识状态下发声控制研究的支持 (Fitch, 2011; Fitch, Huber, & Bugnyar, 2010; Simonyaorwitz, 2011)。在生理学方面,这种人类有向单突触通路促进了疑核对说话和唱歌中复杂意学习的喉部动作的控制能力 (Penfield & Boldrey, 1937; Simonyan & Jürgens, 2003)。
西南大学博士学位论文 Rendall, 2011)。第一条通路则是与习得发音行为的嗓音生成(如语音)有关,需要意志,因此包含初级运动皮层(Primary Motor Cortex)、腹外侧和脑岛部分的额叶,然后连接质下区域,如网状结构(Reticular Formation, RF)、脑桥回(Pontine Grey)和发声运动元(Phonatory Motor Neuron)(位于疑核);而另外一条通路则是固有的且自发的嗓音生路,如非言语的情绪性发声 (Ackermann et al., 2014),该通路从前扣带回(Anterior Cinguortex, ACC)经由导水管周围灰质(Periaqueductal Grey, PAG)及邻近的腹侧被盖(Vengmentum)到网状结构和脑桥回,最终投射到发声运动神经元。因此双通路模型从大脑层面提供了发声行为的两种类型,也对嗓音生成的理解提供了很好的理论基础。
本文编号:2792310
本文链接:https://www.wllwen.com/shekelunwen/xinlixingwei/2792310.html