融合声源分离及反复结构模型的音乐分离方法
发布时间:2021-09-08 18:06
针对现有的单一音乐分离算法难以分离背景音乐和歌声的问题,提出一种融合声源分离及反复结构模型的音乐分离方法。该方法首先通过迭代的方式分离出音乐的谐波声源和冲击声源,再引入节奏谱分析不同声源的能量谱矩阵,对其建立反复周期结构模型,最后保留谐波源的反复周期成分,去除冲击源的反复周期成分,得到分离后的背景音乐和歌声。针对MIR-1K数据库,对1000首音乐片段的分离实验表明,与现有分离方法对比,本文方法在分离背景音乐和歌声时均表现出优异的性能。
【文章来源】:声学学报. 2020,45(05)北大核心EICSCD
【文章页数】:9 页
【部分图文】:
图7随机10首音乐片段分离性能指标对比图??
??度依赖样本,建立词典的过程较复杂,运算最大且易??过度分离。本文方法首先通过迭代运算分离音乐的??谐波声源和冲击声源,再利用节拍信总对不同声源??的能董矩阵建立反复结构模型,最后保留谐波源的??反复结构成分f去除冲击源的反复结构成分,从而得??到分离后的背景音乐和歌声.该方法既汲取了声源??分离算法在提取稀疏性歌声时的优势,又融合了反??复结构模型在对背景音乐建模时的优势,对比单一4??的分离算法,在分离同一段音乐时,融合算法能够更??好地分离出背景音乐和歌声。??图如图1所示.4??图1中可以清晰地看到垂直和水平的结构,谐??波分最通常具有稳定的音高,在语谱图上形成具有??平滑时间包络的平行脊,而冲击源分量的能景集中??在短时间内,形成具有宽频包络的垂直脊,利用各向??异性,将原始功率谱分解为谐波分量和??冲击源分最谐波声源和冲击声源P/m满??足如下代价函数,??p)?=?^?E?(丑丄-讯42?十??H?U?A??'?…?.?CD??_?Ph,i)2,??P?h,i??其中C7H和CTp分别为谐波声源和冲击声源的平滑??度因子,H/M-1和私,H分别表示第i-1帧的谐波??声源和冲击声源,_?H/M)和(P/M-1?_乃M)??分别表示谐波声源和冲击声源前一帧和当前帧的差??值,上式的约束条件为:??Hh,i?+?Ph,i?=?Wh,i,?(2)??Hh^?^?0,?Ph^?^?0.?(3)??8000??7000??6000??货?5000??S?4000??^?3000??2000??1000??0??0.5?1.0?1.5?2.0?2.5?3.0?3.5?
张天等:融合声源分离及.R复结构模型的音乐分离方法??709??{(巧—l,.i?_?十(Pfr.fi?—?%,i)2}.,??需满足:??J(H,P)^Q(H,P,U,V),?(11)??100?200?300?400?500?600?700?BOO??_酸菌(ms)??_?一段音隹雜??图3中峰值周期代表背景咅乐的反复周期??可以根据节奏谱的周期性建立背景咅乐的反复周期??模型。??2融合声源分离及反复结构模型的音??乐分离方法??2.1辅助函数设计??由r-代价函数式⑴对t-所有变量都足二次型??的,所以它足单模并且有一个全局最小值,可以通过??求解a//affft)i=o和aj/si^?=?o直接得到,但足??在计棼过程中会产生大量的和巧,i的联:立方??程。为了避免这种情况,本文采用一种辅劢函数的方??法,通过迭代过程来求解。??为了构建辅劭函数,由矩阵理论可知,当乂和??为实数矩阵时,有:??(4?-?B)2<2.(A?-?X)2?十?2(B?-?JT)??当X?=?十丑)/2时,有:??(6)??J(H,?P)?=?mmQ{H,?P,?U,?V).?(12)??t/",V"??迭代更新公式为:??{U(k+1\?=?C/,?F),?(13)??C/,V"??{Hik+1)P(k+1)}=minQ(H,P,Uik+1\Vik+1)),?(H)??H,P??其中j单调递减,fc.長遊代次数,c/?_?_v分别表示??和的集合。??首先,推导出在约束条件式⑵下,满足式(14)??的IfP+W和PP+A引入拉格朗H乘子Ay,得到:??Q(H,?P)?=?Q{H,?P,?F:<WS>
【参考文献】:
期刊论文
[1]结合HPSS的非负矩阵音乐分离方法[J]. 熊梅,张天骐,张婷,杨凯. 计算机工程与设计. 2018(04)
[2]多反复结构模型的精确音乐分离方法[J]. 张天骐,徐昕,吴旺军,刘瑜. 声学学报. 2016(01)
[3]基于听觉模型与自适应分数阶Fourier变换的声学特征在语音识别中的应用[J]. 尹辉,谢湘,匡镜明. 声学学报. 2012(01)
本文编号:3391245
【文章来源】:声学学报. 2020,45(05)北大核心EICSCD
【文章页数】:9 页
【部分图文】:
图7随机10首音乐片段分离性能指标对比图??
??度依赖样本,建立词典的过程较复杂,运算最大且易??过度分离。本文方法首先通过迭代运算分离音乐的??谐波声源和冲击声源,再利用节拍信总对不同声源??的能董矩阵建立反复结构模型,最后保留谐波源的??反复结构成分f去除冲击源的反复结构成分,从而得??到分离后的背景音乐和歌声.该方法既汲取了声源??分离算法在提取稀疏性歌声时的优势,又融合了反??复结构模型在对背景音乐建模时的优势,对比单一4??的分离算法,在分离同一段音乐时,融合算法能够更??好地分离出背景音乐和歌声。??图如图1所示.4??图1中可以清晰地看到垂直和水平的结构,谐??波分最通常具有稳定的音高,在语谱图上形成具有??平滑时间包络的平行脊,而冲击源分量的能景集中??在短时间内,形成具有宽频包络的垂直脊,利用各向??异性,将原始功率谱分解为谐波分量和??冲击源分最谐波声源和冲击声源P/m满??足如下代价函数,??p)?=?^?E?(丑丄-讯42?十??H?U?A??'?…?.?CD??_?Ph,i)2,??P?h,i??其中C7H和CTp分别为谐波声源和冲击声源的平滑??度因子,H/M-1和私,H分别表示第i-1帧的谐波??声源和冲击声源,_?H/M)和(P/M-1?_乃M)??分别表示谐波声源和冲击声源前一帧和当前帧的差??值,上式的约束条件为:??Hh,i?+?Ph,i?=?Wh,i,?(2)??Hh^?^?0,?Ph^?^?0.?(3)??8000??7000??6000??货?5000??S?4000??^?3000??2000??1000??0??0.5?1.0?1.5?2.0?2.5?3.0?3.5?
张天等:融合声源分离及.R复结构模型的音乐分离方法??709??{(巧—l,.i?_?十(Pfr.fi?—?%,i)2}.,??需满足:??J(H,P)^Q(H,P,U,V),?(11)??100?200?300?400?500?600?700?BOO??_酸菌(ms)??_?一段音隹雜??图3中峰值周期代表背景咅乐的反复周期??可以根据节奏谱的周期性建立背景咅乐的反复周期??模型。??2融合声源分离及反复结构模型的音??乐分离方法??2.1辅助函数设计??由r-代价函数式⑴对t-所有变量都足二次型??的,所以它足单模并且有一个全局最小值,可以通过??求解a//affft)i=o和aj/si^?=?o直接得到,但足??在计棼过程中会产生大量的和巧,i的联:立方??程。为了避免这种情况,本文采用一种辅劢函数的方??法,通过迭代过程来求解。??为了构建辅劭函数,由矩阵理论可知,当乂和??为实数矩阵时,有:??(4?-?B)2<2.(A?-?X)2?十?2(B?-?JT)??当X?=?十丑)/2时,有:??(6)??J(H,?P)?=?mmQ{H,?P,?U,?V).?(12)??t/",V"??迭代更新公式为:??{U(k+1\?=?C/,?F),?(13)??C/,V"??{Hik+1)P(k+1)}=minQ(H,P,Uik+1\Vik+1)),?(H)??H,P??其中j单调递减,fc.長遊代次数,c/?_?_v分别表示??和的集合。??首先,推导出在约束条件式⑵下,满足式(14)??的IfP+W和PP+A引入拉格朗H乘子Ay,得到:??Q(H,?P)?=?Q{H,?P,?F:<WS>
【参考文献】:
期刊论文
[1]结合HPSS的非负矩阵音乐分离方法[J]. 熊梅,张天骐,张婷,杨凯. 计算机工程与设计. 2018(04)
[2]多反复结构模型的精确音乐分离方法[J]. 张天骐,徐昕,吴旺军,刘瑜. 声学学报. 2016(01)
[3]基于听觉模型与自适应分数阶Fourier变换的声学特征在语音识别中的应用[J]. 尹辉,谢湘,匡镜明. 声学学报. 2012(01)
本文编号:3391245
本文链接:https://www.wllwen.com/wenyilunwen/yinlelunwen/3391245.html
最近更新
教材专著