基于双耳空间信息的语音分离研究

发布时间：2017-11-29 01:15

本文关键词：基于双耳空间信息的语音分离研究

【摘要】：语音分离技术尤其是基于人耳听觉的语音分离技术,在语音增强、语音识别和助听器等语音信号处理领域具有重要的地位。本文以双耳空间信息为基础,结合语音信号的稀疏性,提出了两种基于双耳定位的语音分离方法：基于时频掩蔽的语音分离和基于压缩感知的语音分离。对于基于空间信息的多声源混合语音分离,论文主要做了以下几方面的工作：(1)分析了双耳定位的语音分离的研究思路。空间听觉是人耳听觉的一个重要特性,多声源环境下,人耳听觉系统首先整合声源的空间信息,经由大脑的中枢神经,进行定位及分离,本文根据该特性,提出了先通过双耳定位算法对多声源进行定位,再根据定位结果进行语音分离的思路。(2)研究了双耳多声源定位算法。通过对耳间时间差和耳间强度差两个声源定位线索进行模型训练,建立方位映射模型,将多声源混合语音进行参数提取,通过耳间时间差与耳间强度差的联合判定,获取多声源定位结果,包括声源个数及其对应的水平面上的角度。实验结果表明,该定位算法对单声源至多声源定位有较高的定位准确度。(3)提出了基于双耳定位结果的时频掩蔽语音分离算法。在多声源环境下,在频域的同一频点,能量最大的声源将掩蔽其它能量较小的声源,最终只有一个信号占主导,本文依据语音信号的频域稀疏性,根据声源定位的结果,将所有时频点都划分为离该时频点距离最近的声源,将每个声源所划分到的时频点进行时域转换,获得该声源的分离信号。基于双耳定位的时频掩蔽语音分离其实验结果要明显优于同类算法。(4)提出了基于双耳定位结果的压缩感知语音分离算法。本文分析了基于双耳的多声源混合模型,其形式与基本的压缩感知模型是相一致的,因此,本文利用双耳定位结果、声源的字典信息和混合语音构建出压缩感知模型,采用正交匹配追踪算法对多声源混合语音进行重构,实验结果表明,语音分离指标SIR、SNR与时频掩蔽方法相比获得有效提高。
【学位授予单位】：东南大学
【学位级别】：硕士
【学位授予年份】：2015
【分类号】：TN912.3

【相似文献】

中国期刊全文数据库前10条

1 施剑;杜利民;;基于麦克阵列的实时盲语音分离系统[J];微计算机应用;2008年05期

2 张磊;刘继芳;项学智;;基于计算听觉场景分析的混合语音分离[J];计算机工程;2010年14期

3 杨海滨;张军;;基于模型的单通道语音分离综述[J];计算机应用研究;2010年11期

4 虞晓,胡光锐;基于高斯混合密度函数估计的语音分离[J];上海交通大学学报;2000年01期

5 虞晓,胡光锐;基于高斯混合密度函数估计的语音分离[J];上海交通大学学报;2000年02期

6 张雪峰,刘建强,冯大政;一种快速的频域盲语音分离系统[J];信号处理;2005年05期

7 陈锴;卢晶;徐柏龄;;基于话者状态检测的自适应语音分离方法的研究[J];声学学报;2006年03期

8 董优丽;谢勤岚;;不确定信号源个数的语音分离[J];现代电子技术;2008年03期

9 徐方鑫;;瑞米兹交替算法在语音分离上的应用[J];电脑知识与技术;2012年03期

10 刘俊良;于凤芹;;基于分离度变步长的自然梯度算法的语音分离[J];计算机工程与应用;2013年21期

中国重要会议论文全文数据库前5条

1 史晓非;王宪峰;黄耀P;刘人杰;;一个推广参数矢量算法在语音分离中的应用[A];中国航海学会通信导航专业委员会2004学术年会论文集[C];2004年

2 刘学观;陈雪勤;赵鹤鸣;;基于改进遗传算法的混叠语音分离研究[A];第十届全国信号处理学术年会（CCSP-2001）论文集[C];2001年

3 林静然;彭启琮;邵怀宗;;基于麦克风阵列的双波束近场定位及语音分离[A];第二届全国信息获取与处理学术会议论文集[C];2004年

4 茅泉泉;赵力;;基于MIMO的盲信道语音分离技术[A];2004年全国物理声学会议论文集[C];2004年

5 李量;杜忆;吴玺宏;Claude Alain;;人类听皮层在语音分离中对频率线索和空间线索的线性整合[A];增强心理学服务社会的意识和功能——中国心理学会成立90周年纪念大会暨第十四届全国心理学学术会议论文摘要集[C];2011年

中国博士学位论文全文数据库前2条

1 赵立恒;基于计算听觉场景分析的单声道语音分离研究[D];中国科学技术大学;2012年

2 王雨;基于计算听觉场景分析的单通道语音分离研究[D];华东理工大学;2013年

中国硕士学位论文全文数据库前10条

1 赵训川;基于计算听觉场景分析和麦克风阵列的语音分离的研究[D];燕山大学;2015年

2 何求知;单通道语音分离关键技术研究[D];电子科技大学;2015年

3 曹猛;基于计算听觉场景分析和深度神经网络的混响语音分离[D];太原理工大学;2016年

4 李枭雄;基于双耳空间信息的语音分离研究[D];东南大学;2015年

5 张晖;层叠与深度神经网络研究及其在语音分离中的应用[D];内蒙古大学;2014年

6 童开国;多声源环境下基于听觉中枢系统的语音分离研究[D];重庆邮电大学;2012年

7 陈雪勤;基于计算声场景分析的混叠语音分离研究[D];苏州大学;2002年

8 丁文;非负矩阵的分解及其在单声道语音分离中的应用[D];南昌大学;2014年

9 汪健;基于空域滤波的语音分离研究[D];西南交通大学;2011年

10 刘仙伟;卷积语音盲分离的SOPC实现[D];大连理工大学;2011年

，

本文编号：1235668

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/wltx/1235668.html

上一篇：多用户QoS需求的负载均衡算法研究与分析
下一篇：视频切换台的非线性模式发展趋势

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|