社科论文管理论文经济论文科技论文教育论文文艺论文医学论文外语论文硕博论文法律论文理工论文农业论文

当前位置：主页 > 科技论文 > 网络通信论文 >

提高耳语音可懂度的非对称压缩语音增强方法

发布时间：2018-11-08 18:40

【摘要】：提出两种基于非对称代价函数的耳语音增强算法,将语音增强过程中的放大失真和压缩失真区分对待。Modified ItakuraSaito(MIS)算法对放大失真给予更多的惩罚,而Kullback-Leibler(KL)算法则对压缩失真给予更多的惩罚。实验结果表明,在低于—6 dB的低信噪比情况中,经MIS算法增强后的耳语音的可懂度相比传统算法有显著提高;而KL算法则获得了同最小均方误差语音增强算法近似的可懂度提高效果,证实了耳语音中的放大失真和压缩失真对于耳语音可懂度的影响并不相同,低信噪比时较大的压缩失真有助于提高耳语音可懂度,而高信噪比时的压缩失真对耳语音可懂度影响较小。
[Abstract]:Two kinds of speech enhancement algorithms based on asymmetric cost function are proposed in this paper. The. Modified ItakuraSaito (MIS) algorithm distinguishes the amplification distortion from the compression distortion in the speech enhancement process and gives more punishment to the amplification distortion. The Kullback-Leibler (KL) algorithm gives more punishment for compression distortion. The experimental results show that the intelligibility of the speech enhanced by the MIS algorithm is significantly higher than that of the traditional algorithm in the case of low signal-to-noise ratio (SNR) below-6 dB. The KL algorithm achieves the same intelligibility improvement effect as the least mean square error speech enhancement algorithm, which proves that the effects of amplification distortion and compression distortion on the speech intelligibility are not the same. Large compression distortion at low SNR helps to improve the intelligibility of ear speech, while compression distortion with high SNR has little effect on the intelligibility of ear speech.
【作者单位】：安徽大学计算智能与信号处理教育部重点实验室;东南大学水声信号处理教育部重点实验室;东南大学儿童发展与学习科学教育部重点实验室;
【基金】：国家自然科学基金(61301295,61231002,61273266,61003131) 安徽省自然科学基金(1308085QF100,1408085MF113) 安徽大学博士科研启动经费资助
【分类号】：TN912.35

【共引文献】

相关期刊论文前2条

1 何勇军;付茂国;孙广路;;语音特征增强方法综述[J];哈尔滨理工大学学报;2014年02期

2 ZHOU Jian;ZHENG Wenming;WANG Qingyun;ZHAO Li;;Intelligibility enhancement for noisy whispered speech using asymmetric cost function[J];Chinese Journal of Acoustics;2014年03期

相关博士学位论文前1条

1 袁文浩;基于噪声估计的语音增强方法研究[D];华东理工大学;2013年

相关硕士学位论文前8条

1 顾晓江;不匹配信道下耳语音说话人识别研究[D];苏州大学;2011年

2 王辉;数字助听器中汉语语音处理及语音增强的研究[D];南京邮电大学;2012年

3 郭仲廉;越南南方人学习汉语语音的常见错误分析及其教学策略[D];广西大学;2011年

4 袁磊;基于因子分析和支持向量机的耳语说话人识别[D];苏州大学;2012年

5 钱晓红;分数阶傅里叶变换在耳语音说话人识别研究中的应用[D];苏州大学;2012年

6 张东方;基于短时谱估计的低信噪比语音增强技术研究[D];解放军信息工程大学;2012年

7 雍雅琴;数字助听器中主要语音信号处理方法研究[D];北京协和医学院;2013年

8 李娜;有效提高语音可懂度的语音增强方法研究[D];北京工业大学;2013年

【二级参考文献】

相关期刊论文前6条

1 樊星;卢晶;徐柏龄;;汉语耳语音转换为正常音的研究[J];电声技术;2005年12期

2 陈雪勤;赵鹤鸣;;基于听觉模型的汉语耳语音声调检测[J];电子学报;2009年04期

3 张磊,韩纪庆,王承发;声道的调频-调幅模型及其在语音分析中的应用[J];计算机研究与发展;2002年06期

4 郭武;李轶杰;戴礼荣;王仁华;;说话人识别中的因子分析以及空间拼接[J];自动化学报;2009年09期

5 林玮;杨莉莉;徐柏龄;;基于修正MFCC参数汉语耳语音的话者识别[J];南京大学学报(自然科学版);2006年01期

6 王晶,傅丰林,张运伟;语音增强算法综述[J];声学与电子工程;2005年01期

【相似文献】

相关期刊论文前10条

1 杨莉莉,李燕,徐柏龄;汉语耳语音库的建立与听觉实验研究[J];南京大学学报(自然科学版);2005年03期

2 孙静;陶智;顾济华;赵鹤鸣;;基于AD神经网络的耳语音增强的研究[J];计算机工程与应用;2007年29期

3 樊星;卢晶;徐柏龄;;汉语耳语音转换为正常音的研究[J];电声技术;2005年12期

4 林玮;杨莉莉;徐柏龄;;基于修正MFCC参数汉语耳语音的话者识别[J];南京大学学报(自然科学版);2006年01期

5 孙静;陶智;顾济华;赵鹤鸣;;基于LMS自适应滤波的耳语音增强的研究[J];通信技术;2007年12期

6 吕岗;赵鹤鸣;刘建新;龚呈卉;;有效提取耳语音共振峰的改进方法[J];计算机工程与应用;2009年19期

7 荣薇;陶智;顾济华;赵鹤鸣;;基于概率神经网络的汉语耳语音识别系统[J];计算机工程与应用;2008年17期

8 丁国梁;;基于修正MFCC的耳语说话人识别方法[J];苏州大学学报(工科版);2009年04期

9 谈雪丹;顾济华;赵鹤鸣;陶智;沈圆圆;;基于HHT瞬时能频值的含噪耳语音声韵分割[J];通信技术;2010年06期

10 荣薇;陶智;顾济华;赵鹤鸣;;基于改进LPCC和MFCC的汉语耳语音识别[J];计算机工程与应用;2007年30期

相关会议论文前7条

1 邵怀宗;卢志恒;彭启琮;;基于最小均方误差幅度谱的耳语音增强算法[A];2010年通信理论与信号处理学术年会论文集[C];2010年

2 吕岗;赵鹤鸣;;汉语耳语音共振峰频率的提取[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年

3 杨莉莉;徐柏龄;;汉语耳语音声调识别研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年

4 谈雪丹;顾济华;陶智;吴迪;;基于HHT的耳语音声韵分割[A];2009年度全国物理声学会议论文集[C];2009年

5 尹辉;茹婷婷;谢湘;;汉语耳语音数字串识别研究[A];第九届全国人机语音通讯学术会议论文集[C];2007年

6 林玮;;新型汉语耳语音频率尺度在说话人识别中的应用[A];2011'中国西部声学学术交流会论文集[C];2011年

7 陈雪琴;赵鹤鸣;;基于听觉模型的汉语耳语音声调检测[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年

相关博士学位论文前1条

1 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年

相关硕士学位论文前10条

1 黄程;汉语耳语音重建的研究[D];安徽大学;2013年

2 谈雪丹;基于扩展型双线性变换法的耳语音转换为正常语音的研究[D];苏州大学;2010年

3 王敏;基于瞬时频率估计的耳语音说话人识别研究[D];苏州大学;2010年

4 钱晓红;分数阶傅里叶变换在耳语音说话人识别研究中的应用[D];苏州大学;2012年

5 徐娟;清辅音特征分析及其在耳语音说话人识别中的应用[D];苏州大学;2013年

6 荣薇;基于概率神经网络的汉语耳语音识别的研究[D];苏州大学;2008年

7 顾晓江;不匹配信道下耳语音说话人识别研究[D];苏州大学;2011年

8 丁国梁;耳语音说话人识别的研究[D];苏州大学;2009年

9 韩韬;基于RBF神经网络的汉语耳语音转换为正常语音的研究[D];苏州大学;2009年

10 龚呈卉;汉语耳语音声道特性分析及其在汉语耳语感知研究中的应用[D];苏州大学;2008年

，

本文编号：2319330

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/wltx/2319330.html

上一篇：基于DBN的移动自组织网络入侵检测技术研究
下一篇：一种降低电力线正交频分复用系统峰均比的方法

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

最近更新

教材专著

·主编|副主编|备案副主编|编委|参编

热点文章

Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明：资料由用户784a0***提供，本站仅收录摘要或目录，作者需要删除请E-mail邮箱bigeng88@qq.com