当前位置:主页 > 科技论文 > 信息工程论文 >

基于计算听觉场景分析的混合语音分离

发布时间:2019-01-27 10:49
【摘要】:基于计算听觉场景分析的语音分离技术在人工智能、机器感知和自动语音分离等领域有着非常广泛的应用,逐渐成为人们研究的热点,尤其是噪声环境下的语音信号分离最为困难。本文在基于计算听觉场景分析的理论上,对噪声环境下的混合语音信号分离进行了研究,主要针对原有的利用双耳时间差和双耳强度差作为语音分离线索的混合语音分离系统存在的问题进行了深入的研究与改进。首先,本文提出了一种将基音周期性特征与双耳时间差和双耳强度差特征相结合的分离算法,并设计了双重掩蔽模型。改进后的算法利用了两种语音分离线索,从两个不同的角度对混合语音信号进行分析处理,并经过双重掩蔽来实现对目标语音的纯净分离。其次,针对原有系统存在的掩蔽干扰声音不彻底的问题,本文加入了以基音周期性特征作为语音分离线索的分离方法,同时设计出合理的初次掩蔽模型,将混合语音中的噪声和杂音去除,并结合后续的二次掩蔽模型,达到了掩蔽更全面,去除干扰声音更彻底的效果。再次,针对原有系统存在的对于相对时延较大的一路语音不能精确分离的问题,本文在基于双耳时间差和双耳强度差特征进行混合语音分离的部分,对二次掩蔽模型进行了重新的定义与改进,使系统分离目标更加明确,能够精确分离任意一路语音信号。最后,通过大量实验对改进后的系统进行了性能评估,并且与原有语音分离系统进行了分析比较,能够明显的体现改进系统的有效性和优越性。改进后的混合语音分离系统对语音与噪声的分离、混叠语音的分离都是有效的,分离效果也有明显提高。
[Abstract]:Speech separation technology based on computational auditory scene analysis has been widely used in artificial intelligence, machine perception and automatic speech separation, and has gradually become a hot research topic. Especially in noisy environment, speech signal separation is the most difficult. In this paper, based on the theory of computational auditory scene analysis, the mixed speech signal separation in noisy environment is studied. The existing problems of hybrid speech separation system using binaural time difference and binaural intensity difference as cues of speech separation are studied and improved deeply. Firstly, this paper proposes a separation algorithm which combines pitch periodicity with binaural time difference and binaural intensity difference, and designs a double masking model. The improved algorithm uses two kinds of speech separation cues to analyze and process the mixed speech signal from two different angles and realizes the pure separation of the target speech by double masking. Secondly, aiming at the problem of incomplete masking interference in the original system, this paper adds the pitch periodic feature as the separation method of speech separation clue, and designs a reasonable initial masking model. The noise and noise in the mixed speech are removed and combined with the subsequent secondary masking model to achieve a more comprehensive masking effect and a more thorough removal of the interference sound. Thirdly, aiming at the problem that the original system can not be separated accurately for a group of speech with relatively long time delay, this paper presents a method of mixed speech separation based on the features of binaural time difference and binaural intensity difference. The quadratic masking model is redefined and improved to make the separation target more clear and to separate any speech signal accurately. Finally, through a large number of experiments, the performance of the improved system is evaluated, and compared with the original speech separation system, it can obviously reflect the effectiveness and superiority of the improved system. The improved mixed speech separation system is effective for the separation of speech and noise, and the separation effect is also improved.
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3

【相似文献】

相关期刊论文 前10条

1 施剑;杜利民;;基于麦克阵列的实时盲语音分离系统[J];微计算机应用;2008年05期

2 张磊;刘继芳;项学智;;基于计算听觉场景分析的混合语音分离[J];计算机工程;2010年14期

3 杨海滨;张军;;基于模型的单通道语音分离综述[J];计算机应用研究;2010年11期

4 虞晓,胡光锐;基于高斯混合密度函数估计的语音分离[J];上海交通大学学报;2000年01期

5 虞晓,胡光锐;基于高斯混合密度函数估计的语音分离[J];上海交通大学学报;2000年02期

6 张雪峰,刘建强,冯大政;一种快速的频域盲语音分离系统[J];信号处理;2005年05期

7 陈锴;卢晶;徐柏龄;;基于话者状态检测的自适应语音分离方法的研究[J];声学学报;2006年03期

8 董优丽;谢勤岚;;不确定信号源个数的语音分离[J];现代电子技术;2008年03期

9 徐方鑫;;瑞米兹交替算法在语音分离上的应用[J];电脑知识与技术;2012年03期

10 刘俊良;于凤芹;;基于分离度变步长的自然梯度算法的语音分离[J];计算机工程与应用;2013年21期

相关会议论文 前5条

1 史晓非;王宪峰;黄耀P;刘人杰;;一个推广参数矢量算法在语音分离中的应用[A];中国航海学会通信导航专业委员会2004学术年会论文集[C];2004年

2 刘学观;陈雪勤;赵鹤鸣;;基于改进遗传算法的混叠语音分离研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

3 林静然;彭启琮;邵怀宗;;基于麦克风阵列的双波束近场定位及语音分离[A];第二届全国信息获取与处理学术会议论文集[C];2004年

4 茅泉泉;赵力;;基于MIMO的盲信道语音分离技术[A];2004年全国物理声学会议论文集[C];2004年

5 李量;杜忆;吴玺宏;Claude Alain;;人类听皮层在语音分离中对频率线索和空间线索的线性整合[A];增强心理学服务社会的意识和功能——中国心理学会成立90周年纪念大会暨第十四届全国心理学学术会议论文摘要集[C];2011年

相关博士学位论文 前2条

1 赵立恒;基于计算听觉场景分析的单声道语音分离研究[D];中国科学技术大学;2012年

2 王雨;基于计算听觉场景分析的单通道语音分离研究[D];华东理工大学;2013年

相关硕士学位论文 前10条

1 赵训川;基于计算听觉场景分析和麦克风阵列的语音分离的研究[D];燕山大学;2015年

2 何求知;单通道语音分离关键技术研究[D];电子科技大学;2015年

3 曹猛;基于计算听觉场景分析和深度神经网络的混响语音分离[D];太原理工大学;2016年

4 李枭雄;基于双耳空间信息的语音分离研究[D];东南大学;2015年

5 王瑜;基于计算听觉场景分析的三通道语音分离研究[D];燕山大学;2016年

6 王菁;基于计算听觉场景分析的混合语音分离[D];燕山大学;2016年

7 张晖;层叠与深度神经网络研究及其在语音分离中的应用[D];内蒙古大学;2014年

8 童开国;多声源环境下基于听觉中枢系统的语音分离研究[D];重庆邮电大学;2012年

9 陈雪勤;基于计算声场景分析的混叠语音分离研究[D];苏州大学;2002年

10 丁文;非负矩阵的分解及其在单声道语音分离中的应用[D];南昌大学;2014年



本文编号:2416188

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2416188.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c51ec***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com