提高耳语音可懂度的非对称压缩语音增强方法
[Abstract]:Two kinds of speech enhancement algorithms based on asymmetric cost function are proposed in this paper. The. Modified ItakuraSaito (MIS) algorithm distinguishes the amplification distortion from the compression distortion in the speech enhancement process and gives more punishment to the amplification distortion. The Kullback-Leibler (KL) algorithm gives more punishment for compression distortion. The experimental results show that the intelligibility of the speech enhanced by the MIS algorithm is significantly higher than that of the traditional algorithm in the case of low signal-to-noise ratio (SNR) below-6 dB. The KL algorithm achieves the same intelligibility improvement effect as the least mean square error speech enhancement algorithm, which proves that the effects of amplification distortion and compression distortion on the speech intelligibility are not the same. Large compression distortion at low SNR helps to improve the intelligibility of ear speech, while compression distortion with high SNR has little effect on the intelligibility of ear speech.
【作者单位】: 安徽大学计算智能与信号处理教育部重点实验室;东南大学水声信号处理教育部重点实验室;东南大学儿童发展与学习科学教育部重点实验室;
【基金】:国家自然科学基金(61301295,61231002,61273266,61003131) 安徽省自然科学基金(1308085QF100,1408085MF113) 安徽大学博士科研启动经费资助
【分类号】:TN912.35
【共引文献】
相关期刊论文 前2条
1 何勇军;付茂国;孙广路;;语音特征增强方法综述[J];哈尔滨理工大学学报;2014年02期
2 ZHOU Jian;ZHENG Wenming;WANG Qingyun;ZHAO Li;;Intelligibility enhancement for noisy whispered speech using asymmetric cost function[J];Chinese Journal of Acoustics;2014年03期
相关博士学位论文 前1条
1 袁文浩;基于噪声估计的语音增强方法研究[D];华东理工大学;2013年
相关硕士学位论文 前8条
1 顾晓江;不匹配信道下耳语音说话人识别研究[D];苏州大学;2011年
2 王辉;数字助听器中汉语语音处理及语音增强的研究[D];南京邮电大学;2012年
3 郭仲廉;越南南方人学习汉语语音的常见错误分析及其教学策略[D];广西大学;2011年
4 袁磊;基于因子分析和支持向量机的耳语说话人识别[D];苏州大学;2012年
5 钱晓红;分数阶傅里叶变换在耳语音说话人识别研究中的应用[D];苏州大学;2012年
6 张东方;基于短时谱估计的低信噪比语音增强技术研究[D];解放军信息工程大学;2012年
7 雍雅琴;数字助听器中主要语音信号处理方法研究[D];北京协和医学院;2013年
8 李娜;有效提高语音可懂度的语音增强方法研究[D];北京工业大学;2013年
【二级参考文献】
相关期刊论文 前6条
1 樊星;卢晶;徐柏龄;;汉语耳语音转换为正常音的研究[J];电声技术;2005年12期
2 陈雪勤;赵鹤鸣;;基于听觉模型的汉语耳语音声调检测[J];电子学报;2009年04期
3 张 磊,韩纪庆,王承发;声道的调频-调幅模型及其在语音分析中的应用[J];计算机研究与发展;2002年06期
4 郭武;李轶杰;戴礼荣;王仁华;;说话人识别中的因子分析以及空间拼接[J];自动化学报;2009年09期
5 林玮;杨莉莉;徐柏龄;;基于修正MFCC参数汉语耳语音的话者识别[J];南京大学学报(自然科学版);2006年01期
6 王晶,傅丰林,张运伟;语音增强算法综述[J];声学与电子工程;2005年01期
【相似文献】
相关期刊论文 前10条
1 杨莉莉,李燕,徐柏龄;汉语耳语音库的建立与听觉实验研究[J];南京大学学报(自然科学版);2005年03期
2 孙静;陶智;顾济华;赵鹤鸣;;基于AD神经网络的耳语音增强的研究[J];计算机工程与应用;2007年29期
3 樊星;卢晶;徐柏龄;;汉语耳语音转换为正常音的研究[J];电声技术;2005年12期
4 林玮;杨莉莉;徐柏龄;;基于修正MFCC参数汉语耳语音的话者识别[J];南京大学学报(自然科学版);2006年01期
5 孙静;陶智;顾济华;赵鹤鸣;;基于LMS自适应滤波的耳语音增强的研究[J];通信技术;2007年12期
6 吕岗;赵鹤鸣;刘建新;龚呈卉;;有效提取耳语音共振峰的改进方法[J];计算机工程与应用;2009年19期
7 荣薇;陶智;顾济华;赵鹤鸣;;基于概率神经网络的汉语耳语音识别系统[J];计算机工程与应用;2008年17期
8 丁国梁;;基于修正MFCC的耳语说话人识别方法[J];苏州大学学报(工科版);2009年04期
9 谈雪丹;顾济华;赵鹤鸣;陶智;沈圆圆;;基于HHT瞬时能频值的含噪耳语音声韵分割[J];通信技术;2010年06期
10 荣薇;陶智;顾济华;赵鹤鸣;;基于改进LPCC和MFCC的汉语耳语音识别[J];计算机工程与应用;2007年30期
相关会议论文 前7条
1 邵怀宗;卢志恒;彭启琮;;基于最小均方误差幅度谱的耳语音增强算法[A];2010年通信理论与信号处理学术年会论文集[C];2010年
2 吕岗;赵鹤鸣;;汉语耳语音共振峰频率的提取[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年
3 杨莉莉;徐柏龄;;汉语耳语音声调识别研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
4 谈雪丹;顾济华;陶智;吴迪;;基于HHT的耳语音声韵分割[A];2009年度全国物理声学会议论文集[C];2009年
5 尹辉;茹婷婷;谢湘;;汉语耳语音数字串识别研究[A];第九届全国人机语音通讯学术会议论文集[C];2007年
6 林玮;;新型汉语耳语音频率尺度在说话人识别中的应用[A];2011'中国西部声学学术交流会论文集[C];2011年
7 陈雪琴;赵鹤鸣;;基于听觉模型的汉语耳语音声调检测[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年
相关博士学位论文 前1条
1 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年
相关硕士学位论文 前10条
1 黄程;汉语耳语音重建的研究[D];安徽大学;2013年
2 谈雪丹;基于扩展型双线性变换法的耳语音转换为正常语音的研究[D];苏州大学;2010年
3 王敏;基于瞬时频率估计的耳语音说话人识别研究[D];苏州大学;2010年
4 钱晓红;分数阶傅里叶变换在耳语音说话人识别研究中的应用[D];苏州大学;2012年
5 徐娟;清辅音特征分析及其在耳语音说话人识别中的应用[D];苏州大学;2013年
6 荣薇;基于概率神经网络的汉语耳语音识别的研究[D];苏州大学;2008年
7 顾晓江;不匹配信道下耳语音说话人识别研究[D];苏州大学;2011年
8 丁国梁;耳语音说话人识别的研究[D];苏州大学;2009年
9 韩韬;基于RBF神经网络的汉语耳语音转换为正常语音的研究[D];苏州大学;2009年
10 龚呈卉;汉语耳语音声道特性分析及其在汉语耳语感知研究中的应用[D];苏州大学;2008年
,本文编号:2319330
本文链接:https://www.wllwen.com/kejilunwen/wltx/2319330.html