乐曲与歌声分离算法研究
发布时间:2021-03-09 11:16
信息时代下,音乐信息数量不断增涨,导致对音乐信息的检索、识别、处理需求与日俱增。然而背景乐曲与歌声往往具有相关性,它们之间的相互干扰给音乐信息处理带来了巨大障碍。音乐分离技术的研究给上述问题带来了新的探索方向。本文主要研究乐曲和歌声分离问题。在统计技术和计算听觉场景分析技术两大理论下,对NMF分离技术、音乐信息特征分析技术、听觉声学模型进行了研究。在此基础上,重点对音乐反复结构建立和背景乐曲提取等问题进行了深入研究,最后对基于音乐反复性的乐曲和歌声分离算法中存在的问题进行了一些改进,主要创新点有以下两个方面:(1)基于多反复结构的音乐分离音乐信号是随着时间变化而变化的,因此音乐的反复特征也是随音乐的变化而变化的。本文提出了一种基于多反复结构的音乐分离算法,通过多反复结构模型来更好的符合音乐自身变化的特点,并且利用了MFCC特征来建立反复结构模型。通过实验结果表明,该方法能较真实的反映音乐本身的反复性,一定程度上提高分离性能。(2)基于音源类型分析的音乐分离在以往的反复分离算法中,节奏缓慢,韵律较弱的音源容易被反复模型忽略掉,为了能较好的分离出这一类音源,本文采用了谐波、冲击源分离思想,促进这类音源的分离性能改善。通过谐波、冲击源分离思想和多反复结构模型共同作用对背景乐曲中不同类型音源进行分别分离。实验结果表明,对节奏韵律弱的音源进行单独分离后,大大减少了歌声中残留的乐曲音源,从而改善了分离性能。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.3
本文编号:1417879
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.3
文章目录
摘要
Abstract
第一章 绪论
1.1 选题背景意义
1.2 音乐分离技术现状
1.2.1 统计技术
1.2.2 计算听觉场景分析技术
1.2.3 基于音乐反复性的分离技术
1.3 论文的主要内容及章节安排
1.3.1 本文的研究内容
1.3.2 本文的结构安排
第二章 音乐分离技术基础
2.1 引言
2.2 基本乐理知识
2.3 音频信号时频分析
2.3.1 傅里叶变换
2.3.2 小波变换
2.3.3 倒谱变换
2.3.4 Gammatone滤波器
2.4 音乐分离技术
2.4.1 NMF基本思想
2.4.2 CASA基本思想
2.5 性能评价标准
2.6 小结
第三章 基于多反复结构的音乐分离
3.1 引言
3.2 反复分离算法
3.2.1 反复结构模型
3.2.2 建立乐曲反复结构
3.2.3 背景乐曲提取
3.3 基于MFCC的多反复结构分离算法
3.3.1 Mel频率倒谱系数
3.3.2 多反复结构模型
3.4 实验结果
3.4.1 瞬时混合音乐分离实验
3.4.2 真实音乐分离实验
3.5 小结
第四章 基于音源类型分析的音乐分离
4.1 引言
4.2 谐波源、冲击源
4.2.1 两类音源的表现形式
4.2.2 谐波源分离算法
4.3 基于乐曲音源类型分析的分离算法
4.3.1 音源类型分析
4.3.2 谐波音源分离
4.3.3 歌声分离
4.4 实验结果
4.5 小结
第五章 总结与展望
5.1 论文工作总结
5.2 研究工作展望
致谢
参考文献
【参考文献】
相关期刊论文 前1条
1 关勇;李鹏;刘文举;徐波;;基于计算听觉场景分析和语者模型信息的语音识别鲁棒前端研究[J];自动化学报;2009年04期
本文编号:1417879
本文链接:https://www.wllwen.com/kejilunwen/wltx/1417879.html