基于深度学习语音分离技术的研究现状与进展
本文选题:神经网络 + 语音分离 ; 参考:《自动化学报》2016年06期
【摘要】:现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入了巨大的努力,提出了很多实用的方法.特别是近年来,由于深度学习研究的兴起,基于深度学习的语音分离技术日益得到了广泛关注和重视,显露出了相当光明的应用前景,逐渐成为语音分离中一个新的研究趋势.目前已有很多基于深度学习的语音分离方法被提出,但是,对于深度学习语音分离技术一直以来都缺乏一个系统的分析和总结,不同方法之间的联系和区分也很少被研究.针对这个问题,本文试图对语音分离的主要流程和整体框架进行细致的分析和总结,从特征、模型以及目标三个方面对现有的前沿研究进展进行全面而深入的综述,最后对语音分离技术进行展望.
[Abstract]:At present, the technology of speech interaction is widely used in real life. However, due to the existence of interference, the technology of voice interaction in real environment is far from satisfactory. The technology of speech separation based on additive noise is an effective way to improve the performance of speech interaction. In recent decades, many researchers all over the world have put in great efforts and put forward many practical methods. Especially in recent years, due to the rise of deep learning research, the technology of speech separation based on deep learning has been paid more and more attention, showing a bright prospect of application, and gradually becoming a new research trend in speech separation. At present, many speech separation methods based on deep learning have been proposed. However, there is a lack of systematic analysis and summary of the deep learning speech separation technology, and the relationship and distinction between different methods are seldom studied. In order to solve this problem, this paper attempts to analyze and summarize the main flow and the whole framework of speech separation in detail, and make a comprehensive and in-depth review of the current research progress in the three aspects of features, models and objectives. Finally, the speech separation technology is prospected.
【作者单位】: 中国科学院自动化研究所模式识别国家重点实验室;内蒙古大学计算机系;
【基金】:国家自然科学基金(61573357,61503382,61403370,61273267,91120303,61365006)资助~~
【分类号】:TP183;TP181
【相似文献】
相关期刊论文 前10条
1 施剑;杜利民;;基于麦克阵列的实时盲语音分离系统[J];微计算机应用;2008年05期
2 张磊;刘继芳;项学智;;基于计算听觉场景分析的混合语音分离[J];计算机工程;2010年14期
3 杨海滨;张军;;基于模型的单通道语音分离综述[J];计算机应用研究;2010年11期
4 虞晓,胡光锐;基于高斯混合密度函数估计的语音分离[J];上海交通大学学报;2000年01期
5 虞晓,胡光锐;基于高斯混合密度函数估计的语音分离[J];上海交通大学学报;2000年02期
6 张雪峰,刘建强,冯大政;一种快速的频域盲语音分离系统[J];信号处理;2005年05期
7 陈锴;卢晶;徐柏龄;;基于话者状态检测的自适应语音分离方法的研究[J];声学学报;2006年03期
8 董优丽;谢勤岚;;不确定信号源个数的语音分离[J];现代电子技术;2008年03期
9 徐方鑫;;瑞米兹交替算法在语音分离上的应用[J];电脑知识与技术;2012年03期
10 刘俊良;于凤芹;;基于分离度变步长的自然梯度算法的语音分离[J];计算机工程与应用;2013年21期
相关会议论文 前5条
1 史晓非;王宪峰;黄耀P;刘人杰;;一个推广参数矢量算法在语音分离中的应用[A];中国航海学会通信导航专业委员会2004学术年会论文集[C];2004年
2 刘学观;陈雪勤;赵鹤鸣;;基于改进遗传算法的混叠语音分离研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
3 林静然;彭启琮;邵怀宗;;基于麦克风阵列的双波束近场定位及语音分离[A];第二届全国信息获取与处理学术会议论文集[C];2004年
4 茅泉泉;赵力;;基于MIMO的盲信道语音分离技术[A];2004年全国物理声学会议论文集[C];2004年
5 李量;杜忆;吴玺宏;Claude Alain;;人类听皮层在语音分离中对频率线索和空间线索的线性整合[A];增强心理学服务社会的意识和功能——中国心理学会成立90周年纪念大会暨第十四届全国心理学学术会议论文摘要集[C];2011年
相关博士学位论文 前2条
1 赵立恒;基于计算听觉场景分析的单声道语音分离研究[D];中国科学技术大学;2012年
2 王雨;基于计算听觉场景分析的单通道语音分离研究[D];华东理工大学;2013年
相关硕士学位论文 前10条
1 赵训川;基于计算听觉场景分析和麦克风阵列的语音分离的研究[D];燕山大学;2015年
2 何求知;单通道语音分离关键技术研究[D];电子科技大学;2015年
3 张晖;层叠与深度神经网络研究及其在语音分离中的应用[D];内蒙古大学;2014年
4 童开国;多声源环境下基于听觉中枢系统的语音分离研究[D];重庆邮电大学;2012年
5 陈雪勤;基于计算声场景分析的混叠语音分离研究[D];苏州大学;2002年
6 丁文;非负矩阵的分解及其在单声道语音分离中的应用[D];南昌大学;2014年
7 汪健;基于空域滤波的语音分离研究[D];西南交通大学;2011年
8 刘仙伟;卷积语音盲分离的SOPC实现[D];大连理工大学;2011年
9 宋岳阳;基于单源欠定语音分离的音乐主旋律提取方法研究[D];北京邮电大学;2012年
10 吴春;基于计算听觉场景分析的双说话人混合语音分离研究[D];广西大学;2014年
,本文编号:1897769
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1897769.html