抑制多方向语音噪声的人工耳蜗语音增强算法
发布时间:2021-07-06 16:05
在复杂声音场景,尤其是多人对话交谈的情况中,人工耳蜗佩戴者的言语可懂度会显著下降。该文提出了一种基于近距离双麦克风的语音增强算法,通过提取采集信号的延迟参数,并根据该参数设置掩蔽矩阵,进而区分不同方位的声源,抑制竞争性语音噪声。同时还以数字信号处理器(digital signal processor, DSP)为核心,搭建调试平台,对算法进行了工程实现。实际测试表明,算法提升了前端信号的信噪比,鲁棒性强,并且算法单帧运行时间短,可以和常用的人工耳蜗言语编码策略相融合,满足人工耳蜗的实时计算需求。
【文章来源】:清华大学学报(自然科学版). 2020,60(02)北大核心EICSCD
【文章页数】:8 页
【图文】:
图1 双麦克风与声源位置示意图
算法流程图
参考CI产品的大小与尺寸, 本文设计了一套算法调试平台。 硬件平台包括采集系统和信号处理系统两大部分, 其中采集系统使用2个全向型的微型麦克风, 型号为SPU0410HR5H, 采集声音并转换为模拟电信号, 双麦克风的距离设置为17 mm。 采集系统参考文[14]中的前置调理电路, 将模拟信号进行工频滤波和多级放大, 使得采集系统的性能指标与目前CI的近距离双麦克风等效。 信号处理系统的核心处理器是型号为C6748的数字信号处理器(digital signal processor, DSP), 音频编解码器采用的是TLV320AIC3106(以下简称AIC3106) 芯片。 C6748是TI公司生产的一款32位的浮点DSP, 共有144个功能复用的输入输出引脚, 可以同时配置多声道音频串口(multichannel audio serial port, McASP)、 串行外设接口(serial peripheral interface, SPI)等众多外设模块, 方便调试平台后续的功能扩展和算法的整合。 AIC3106芯片的采样率范围为8~96 kHz, 支持LINE-IN和MIC-IN两种输入方式。 整体的硬件结构图如图3所示。双麦克风采集到的信号通过音频线以左右声道的形式传输到AIC3106的模数转换器(analog-to-digital converter, ADC), C6748通过集成电路总线(inter-integrated circuit, IIC)控制与AIC3106的数据交换, C6748处理后的结果传输到AIC3106内部的数模转换器 (digital-to-analog converter, DAC) 模块进行数模转换, 最终由LINE-OUT口输出处理过的音频信号。 为了方便调试和存储数据, 系统还增加了外部存储器DDR2 (double data rate SDRAM), 并通过JTAG (joint test action group) 接口与计算机保持通信。
【参考文献】:
期刊论文
[1]基于波束形成与最大似然估计的近距离双麦克风语音增强算法[J]. 宫琴,郑硕. 清华大学学报(自然科学版). 2018(06)
[2]基于双TP型麦克风的电子耳蜗前端指向性语音增强系统的研制[J]. 陈又圣,宫琴. 仪器仪表学报. 2010(09)
本文编号:3268544
【文章来源】:清华大学学报(自然科学版). 2020,60(02)北大核心EICSCD
【文章页数】:8 页
【图文】:
图1 双麦克风与声源位置示意图
算法流程图
参考CI产品的大小与尺寸, 本文设计了一套算法调试平台。 硬件平台包括采集系统和信号处理系统两大部分, 其中采集系统使用2个全向型的微型麦克风, 型号为SPU0410HR5H, 采集声音并转换为模拟电信号, 双麦克风的距离设置为17 mm。 采集系统参考文[14]中的前置调理电路, 将模拟信号进行工频滤波和多级放大, 使得采集系统的性能指标与目前CI的近距离双麦克风等效。 信号处理系统的核心处理器是型号为C6748的数字信号处理器(digital signal processor, DSP), 音频编解码器采用的是TLV320AIC3106(以下简称AIC3106) 芯片。 C6748是TI公司生产的一款32位的浮点DSP, 共有144个功能复用的输入输出引脚, 可以同时配置多声道音频串口(multichannel audio serial port, McASP)、 串行外设接口(serial peripheral interface, SPI)等众多外设模块, 方便调试平台后续的功能扩展和算法的整合。 AIC3106芯片的采样率范围为8~96 kHz, 支持LINE-IN和MIC-IN两种输入方式。 整体的硬件结构图如图3所示。双麦克风采集到的信号通过音频线以左右声道的形式传输到AIC3106的模数转换器(analog-to-digital converter, ADC), C6748通过集成电路总线(inter-integrated circuit, IIC)控制与AIC3106的数据交换, C6748处理后的结果传输到AIC3106内部的数模转换器 (digital-to-analog converter, DAC) 模块进行数模转换, 最终由LINE-OUT口输出处理过的音频信号。 为了方便调试和存储数据, 系统还增加了外部存储器DDR2 (double data rate SDRAM), 并通过JTAG (joint test action group) 接口与计算机保持通信。
【参考文献】:
期刊论文
[1]基于波束形成与最大似然估计的近距离双麦克风语音增强算法[J]. 宫琴,郑硕. 清华大学学报(自然科学版). 2018(06)
[2]基于双TP型麦克风的电子耳蜗前端指向性语音增强系统的研制[J]. 陈又圣,宫琴. 仪器仪表学报. 2010(09)
本文编号:3268544
本文链接:https://www.wllwen.com/yixuelunwen/swyx/3268544.html