音乐信号中的人声伴奏分离研究
发布时间:2020-10-22 16:11
随着信息化时代的到来,海量数字音乐下的音乐标注、检索、识别、歌声基音跟踪等音乐信号处理技术的需求不断增加。其中,音乐信号中的人声伴奏分离作为这些技术研究的前期处理,日益受到关注。一个良好的人声伴奏分离系统能为后期处理带来便捷以及提供良好的性能保障,故具有重要的研究价值。然而人声伴奏分离技术不同于音频信号中的去噪分离技术,其间的相互干扰给学术研究带来了不少挑战。本文主要研究音乐信号中的人声伴奏分离问题,包括以下几个方面:(1)为解决非负矩阵分解(Non-negative Matrix Factorization,NMF)在人声伴奏分离中适应性差且过度依赖学习样本的问题,研究了一种结合谐和与击打声源分离(Harmonic Percussive Source Separation,HPSS)的NMF人声伴奏分离方法。首先,在高分辨率下通过HPSS算法对音乐信号进行声源分离;其次,保留谐和声源并利用灵活窗NMF算法对击打声源进行二次分离;最后,对结合理想二元掩蔽模型(Ideal Binary Mask,IBM)分离出的伴奏及人声的频谱作相应的傅里叶逆变换。研究表明,根据两种分离算法在人声伴奏分离上的优缺点,将它们结合到一起能够有效地扬长避短,提高分离性能。(2)针对音乐信号中的人声与伴奏相互关联难以分离的问题,研究了一种基于区分性训练深度神经网络(Deep Neural Network,DNN)的人声伴奏分离方法。首先,在DNN模型的基础上同时考虑人声与伴奏间的重建误差和区分性信息,研究了一种改进的区分性目标函数;其次,在DNN模型上额外添加一层,引入时频掩蔽对估计出的人声与伴奏进行联合优化,相应的时域信号由傅里叶逆变换获得。研究表明,DNN模型能够获取音乐信号的特征,分离性能得到较大的提高。(3)根据深度循环神经网络(Deep Recurrent Neural Network,DRNN)具有强大的动态建模能力,即利用过去信号的时间依赖关系分析数据特征,从而可以对当前或者未来信号进行合理预测,研究了一种基于DRNN的人声伴奏分离方法。在DNN结构下的人声伴奏分离方法的基础上,利用区分性目标函数区分训练DRNN参数,并引入时频掩蔽模型联合优化得到DRNN模型。研究表明,基于DRNN结构下的人声伴奏分离模型能较真实地反应音乐本身信息,能较大提高分离性能。
【学位单位】:重庆邮电大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:J614.8;TN912.3
【部分图文】:
的产生发音器官产生,是用来进行社会交际的声音部分,即调音区、声源区和动力区,如图 2.//www.51wendang.com/doc/c0baadca57025ca7e产生语音信号。调音区由口腔、鼻腔和咽腔组,鼻化音等不同的声音。声源区指位于喉头中,声带肌的活动可以使声带收紧或者放松发膈膜和气管,它们通过呼吸的气流为语音的产。语音根据声带的松紧程度可分为浊音,声带些辅音;清音,声带完全舒展声道收缩下发出舒展声道完全闭合下发出的音,如 b、p。
【参考文献】
本文编号:2851818
【学位单位】:重庆邮电大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:J614.8;TN912.3
【部分图文】:
的产生发音器官产生,是用来进行社会交际的声音部分,即调音区、声源区和动力区,如图 2.//www.51wendang.com/doc/c0baadca57025ca7e产生语音信号。调音区由口腔、鼻腔和咽腔组,鼻化音等不同的声音。声源区指位于喉头中,声带肌的活动可以使声带收紧或者放松发膈膜和气管,它们通过呼吸的气流为语音的产。语音根据声带的松紧程度可分为浊音,声带些辅音;清音,声带完全舒展声道收缩下发出舒展声道完全闭合下发出的音,如 b、p。
【参考文献】
相关期刊论文 前5条
1 王山海;景新幸;杨海燕;;基于深度学习神经网络的孤立词语音识别的研究[J];计算机应用研究;2015年08期
2 徐昕;张天骐;石穗;张亚娟;;结合语音增强的基音检测改进方法[J];计算机工程与设计;2015年03期
3 屈俊玲;李鸿燕;;基于计算听觉场景分析的混合语音信号分离算法研究[J];计算机应用研究;2014年12期
4 李乐;章毓晋;;非负矩阵分解算法综述[J];电子学报;2008年04期
5 王泽,朱贻盛,王自明,张红煊;基于ICA的重叠语音基频提取和语音增强[J];北京生物医学工程;2001年04期
相关硕士学位论文 前5条
1 赵天坤;基于深度神经网络的音乐信息检索[D];北京邮电大学;2015年
2 吴本谷;音乐中人声分离研究[D];电子科技大学;2015年
3 李冰瑶;基于听觉场景分析的主旋律提取[D];北京邮电大学;2015年
4 翟鹏;基于非负矩阵分解的单通道音乐分离研究[D];西南交通大学;2013年
5 黄雯雯;基于非负矩阵分解的盲信号分离方法研究[D];杭州电子科技大学;2013年
本文编号:2851818
本文链接:https://www.wllwen.com/kejilunwen/wltx/2851818.html