人工耳蜗新型编码方案的研究与仿真

发布时间：2017-12-24 08:20

本文关键词：人工耳蜗新型编码方案的研究与仿真　出处：《南方医科大学》2013年硕士论文　论文类型：学位论文

【摘要】：人工耳蜗是一种为聋人恢复或获得听力的电子装置,此装置能把声音信号转变为电信号直接刺激听神经纤维,激发生物电流,从而在大脑皮层形成听觉。对正常听力的人来说,声波的振动被耳廓收集,通过外耳道到达鼓膜,经听小骨传至内耳外淋巴,引起基底膜的振动。基底膜上毛细胞的纤毛产生扭曲引起细胞膜的电位变化,从而释放出神经递质,进而使位于毛细胞底部的听神经末梢纤维产生电位变化,这种电位变化经螺旋神经节细胞传至中枢,产生听觉。感音性耳聋病人有不同程度的毛细胞病变或减少,但还是保留着一定数量的听神经纤维和螺旋神经节细胞,因此通过电刺激的方法可以恢复听觉。人工耳蜗就是对耳蜗功能的模仿,根据耳蜗部位编码的原理,把一组电极通过手术植入到耳蜗的鼓阶内,体外语音处理器对语音信号进行编码处理产生相应电极的电刺激脉冲序列,并传入体内。体内植入装置接受电刺激脉冲序列,并直接兴奋耳蜗内不同部位电极附近的听神经,使患者产生类似于真实听觉的感受,从而达到恢复听觉的目的。现在世界上主要的三大人工耳蜗生产商分别是澳大利亚的Cochlear公司,奥地利的MED-EL公司和美国的Advanced Bionics公司。至2010年初,全世界有十几万聋人使用了人工耳蜗,其中半数以上是儿童。语音编码方案是人工耳蜗的关键技术之一。人工耳蜗所使用的语音编码方案大致分为两类,即包络特征方案(Coarse feature)和精细特征方案(Fine feature)。包络特征方案包括频域包络显性特征提取和时域包络显性特征提取这两种。频域包络显性特征是把语音信号的基频和共振峰等参数提取出来,然后合成相应的刺激脉冲来刺激听神经。共振峰是语音信号的谱峰,一般取前3个峰值(F1,F2,F3),其频点位置与刺激电极的位置相对应,其幅度大小决定刺激脉冲的幅度。共振峰频率越高,所选电极越靠近蜗底,反之,越靠近蜗顶。刺激频率越高,电极越靠近蜗底,反之,越靠近蜗顶。这类编码方案主要包括FO/F2、FO/F1/F2和MPEAK (Multi-peaks,多峰)方案。时域包络显性特征提取是基于听觉模型的带通滤波器组的方法,将语音信号预处理后通过多个带通滤波器,再经过一系列的处理,最后得到各个电极的刺激脉冲序列。这类方案又可分为模拟刺激(Analog Stimulation)方案(如SAS方案)和脉冲刺激(Pulsatile Stimulation)方案(如CIS方案、SPEAK方案、ACE方案等)。现在的人工耳蜗产品中以CIS (Continuous Interleaved Sampling,连续相间采样)方案、SPEAK方案、ACE (Advanced Confined Encoding,高级结合编码)方案为主。其中,效果最为突出的是美国学者Wilson在1991年在Nature上的一篇文章中提出了对压缩模拟(CA)法的改进方案,称为CIS方案和澳大利亚Cochlear公司使用的ACE方案。精细特征方案(Fine feature)主要包括频域精细结构(Spectral fine structure)方案和时域精细结构(Temporal fine structure)方案,分别对应美国Advanced Bionics公司的HiRes90K使用的虚拟通道(Virtual channels)方案和奥地利人工耳蜗的FAME (Frequency Amplitude Modulation Encoding)方案。现有的人工耳蜗语音编码方法基本上只是考虑了语音信号到电信号的一个数学物理转换过程,而没有从人体生理方面出发。因为绝大多数感音神经性耳聋病理基础源于毛细胞的丧失或功能缺陷,人工耳蜗就是一种为了取代毛细胞的功能,把声音信号转变为电信号直接刺激听神经纤维的装置。而耳蜗毛细胞的功能则是将声波的机械能转换为生物性电能和释放神经递质触发听神经产生神经动作电位。正常的听觉过程是：首先声音经过传声系统使耳蜗毛细胞产生感受器电位(电1),然后毛细胞释放化学递质使突触产生突触电位(电2),最后听神经纤维兴奋产生神经冲动(电3)并传至听觉中枢产生听觉感受。而从声音传入到听神经产生神经动作电位其中有两个环节有生物电变化(电1和电2),但是由于感受器传输特性的非线性,两种电位的参数特性是不同的。目前的人工耳蜗所使用的语音编码方案把声信号转换成电信号直接刺激听神经,其输出的电信号只是与正常听觉的感受器电位(电1)接近,却与突触电位(电2)不太一样,这样产生的听觉感受与正常听觉显然是有一定区别的。如果给予声音刺激的话,听神经的反应会随着声音强度的增大,产生动作电位的潜伏期会减小,但是给予电刺激的话,只要是阈上刺激,听神经会同时响应。现有的人工耳蜗编码方案忽略了突触的时间编码效应,也就忽略了听觉中枢的时间编码、传递和处理特性,而这种时间编码的特性恰恰是听觉中枢编码信息最重要特性之一,这也有可能是现有人工耳蜗无法使患者获得理想听觉的主要原因。本文从以上问题出发,对人工耳蜗编码方案展开研究,主要内容安排如下：首先本文对国际上主流的三种人工耳蜗编码方案(CIS、SPEAK和ACE)进行了MATLAB仿真,这三种编码方案都可以归类为nofm滤波器组方案,把经过预处理的声音通过m个带通滤波器滤波得到m个输出,再把m个输出分别提取包络获得其振幅(A1,A2,…,Am),最后选出其中n个最大的振幅来对其相应的电极进行刺激。CIS方案m值与n值相同,取8或者12。SPEAK方案m值为20,n值为5-10,平均为6。ACE方案m值为22,n值为1-20,平均为8。它们都采用双向脉冲相间调制,所有电极的脉冲刺激均不重叠,呈相间分布,就是说同一时刻只有一个通道被刺激,这样可避免不同通道电极间的相互干扰。CIS方案的刺激速率一般选择900Hz,SPEAK方案的电脉冲刺激速率在180到300Hz不等,平均为250Hz,当声音频谱越宽时,所选的通道数目越多,刺激速率就会越低,相反,当声音频谱越窄,所选的通道数目越少,刺激速率反而越高。ACE方案的通道选择方法和刺激关系与SPEAK方案类似,不同的是刺激速率大幅提升,供选择的有250、500、700、900、1200、1800、及2400Hz,平均约为900Hz。这三种方案有个明显的缺点,不管是CIS,还是SPEAK或者ACE,只要它们调制的通道数和刺激速率固定下来,它们的刺激时间间隔都是不变的。而不会随着刺激声音强度的变化实时变化,即声音强度变大时,刺激间隔就会变短,反之,刺激间隔就会变长。然后,针对上述问题,本文结合听觉生理刺激产生的机制,把毛细胞和听神经纤维形成的突触的时间编码作用考虑进去,提出一种使用膜电位积分放电(Membrane Potential Integrate-and-Fire,简称MPIF)来改善人工耳蜗音质的语音编码方案,在原有语音信号带通整流提取包络的前提下,以膜电位积分放电来生成刺激脉冲序列,也就是以动作电位作为刺激脉冲来刺激耳蜗听神经,以期能从新的角度为人工耳蜗用户改善声音感觉的质量,获得听觉效果的提升。MPIF方案的流程是：把经过预处理的声音通过8(可扩展为12或者16)个滤波器滤波得到8个输出,再把8个输出分别提取包络获得其振幅(A1,A2,…,A8),接着把各个振幅进行非线性压缩得到膜电位,之后进行膜电位积分,当膜电位积分达到阈值就产生一个刺激,膜电位也瞬时下降为零进行下一次积分(如果有几个通道同时达到阈值,则取积分时间最短的通道进行刺激,这几个通道的膜电位同时下降为零进行下一次积分),这样就产生了一连串的刺激序列。只要积分步长合适,就可以既减小同时达到阈值的通道数,又可以避免通道间刺激电极间的相互干扰。对MPIF方案在MATLAB平台上做了仿真,并与CIS方案进行对比,结果表明MPIF方案结合了耳蜗的声电转换作用和突触的时间编码作用,能够随着声音强度的增加,生成的刺激序列的刺激速率也越大,能够有效的解决听觉信息发放序列的动态结构在听觉中枢的作用问题,使得刺激脉冲和时间编码有机的集合起来,有效的保证刺激脉冲时间的相干性和相关性。之后对MPIF方案进行了进一步的研究,加入了抑制性电流来表示神经元动作电位的不应期,仿真结果表明,加入抑制性电流,生成的刺激速率会相对更低,刺激速率与输入声音强度的关系也更加符合生理上的原理。最后,本文应用艾睿合众SEED_DEC138开发板,设计了人工耳蜗体外语音处理器。此语音处理器可以通过麦克风采集声音信号,进行抗混叠滤波,AD转换输入OMAP-L138对采集到的信号进行MPIF算法处理并保存处理结果。整个信号采集处理流程是：语音信号经音频采样芯片PCM4201进行AD采样,得到采样频率为32kHz,采样位数为24bit,数据率为728kbps的单声道语音数据,再通过McBSP送到DSP进行处理,由EDMA方式进行传输。数据存储采用乒乓缓冲架构,当一个缓存区满的时候则存储到另外一个缓存区,同时进入EDMA传输完成中断处理已满缓存区的数据,实施交替处理,就可以实时快速的处理采集到的数据。然后对采集到的声音信号进行FIR带通滤波,整流,FIR低通滤波提取包络,再进行MPIF算法的处理得到8个通道的刺激序列,最后把得到的刺激序列EDMA传输保存到SDRAM上。
【学位授予单位】：南方医科大学
【学位级别】：硕士
【学位授予年份】：2013
【分类号】：R318.18

【参考文献】