复合音乐中歌声旋律的提取
发布时间:2017-04-22 18:15
本文关键词:复合音乐中歌声旋律的提取,,由笔耕文化传播整理发布。
【摘要】:复合音乐中歌声旋律的提取是音频信息检索领域的重点和难点。歌声旋律的提取在歌声分离、歌手识别以及哼唱检索中应用广泛。歌声旋律提取的主要任务是提取复合音乐中歌声的基频轨迹。本文的研究可在一定程度上提高歌声旋律提取的准确度。本文利用频域和倒频域特征对复合音乐进行歌声检测。本文考察梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC)和基于线性预测谱的梅尔倒谱系数(LPc-derived Mel Cepstrum Coefficient, LPMCC)对歌声检测的效果。实验结果表明,LPMCC的检测结果优于MFCC。考察对数频率功率系数(Log Frequency Power Coefficient, LFPC)以及在此基础上提出了梅尔频率功率系数(Mel Frequency Power Coefficient, MFPC)和Gammatone频率功率系数(Gammatone Frequency Power Coefficient, GFPC)的检测效果。实验结果表明,25维的LFPC的歌声检测准确率最好。本文采用迭代谱减算法和改进的谐波乘积谱算法(Modified Harmonic Product Spectrum, MHPS)对复合音乐进行多基频估计,并比较这两种算法的性能。迭代谱减算法主要解决多基频估计中谐波重叠的问题,而MHPS算法在一定程度上解决了多基频估计中基频丢失和八度错误的问题。实验结果表明,迭代谱减算法每帧估计的基频个数明显小于MHPS算法,而且迭代谱减算法能得到更好的原始基频准确率。本文对得到的多基频集合根据时间连续性和频率连续性进行基频轨迹的跟踪,通过实验发现:经过基频轨迹跟踪之后,原始基频跟踪准确率略有提高,而且排除了较多的野点。本文提出了基于谐波能量比的方法确定歌声的旋律,并总结了两种已有的方法,分别是基于频率调制的方法和基于特征组合的方法。对比这三种方法的性能发现:基于特征组合的方法能够更好地确定基频轨迹中的歌声基频轨迹,提高了歌声基频提取的准确率。
【关键词】:歌声旋律提取 歌声检测 多基频估计 基频轨迹
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【目录】:
- 中文摘要8-9
- Abstract9-11
- 缩写说明11-12
- 第1章 绪论12-17
- 1.1 研究背景与意义12-13
- 1.2 课题研究现状与发展趋势13-15
- 1.3 本文主要工作与内容安排15-17
- 第2章 基础知识17-23
- 2.1 基本概念17-19
- 2.1.1 音的四要素17
- 2.1.2 基音与泛音17-18
- 2.1.3 旋律18-19
- 2.1.4 随机森林19
- 2.2 歌声旋律提取的流程19-20
- 2.3 实验数据库介绍20-21
- 2.4 评价准则21-22
- 2.5 本章小结22-23
- 第3章 歌声检测23-39
- 3.1 梅尔频率倒谱系数及其改进23-29
- 3.1.1 梅尔频率倒谱系数23-24
- 3.1.2 对数频率倒谱系数24-25
- 3.1.3 共振峰频率倒谱系数25-26
- 3.1.4 基于颤音的八度频率倒谱系数26-27
- 3.1.5 基于谐波的八度频率倒谱系数27
- 3.1.6 音色倒谱系数27-28
- 3.1.7 Gammatone倒谱系数28-29
- 3.2 线性预测系数及其倒谱系数29-30
- 3.2.1 线性预测系数29-30
- 3.2.2 线性预测倒谱系数30
- 3.3 感知线性预测系数30-31
- 3.4 基于线性预测谱的梅尔倒谱系数31-32
- 3.5 小波能量32-34
- 3.5.1 小波变换32-33
- 3.5.2 小波能量33-34
- 3.6 对数频率功率系数及其改进34-35
- 3.7 特征提取及实验结果分析35-38
- 3.8 本章小结38-39
- 第4章 多基频估计与歌声旋律确定39-53
- 4.1 多基频估计算法39-42
- 4.1.1 迭代谱减算法39-40
- 4.1.2 改进的谐波乘积谱算法40-41
- 4.1.3 结果分析及比较41-42
- 4.2 基频轨迹的跟踪42-44
- 4.3 歌声旋律的确定44-52
- 4.3.1 基于频率调制的方法44-46
- 4.3.2 基于谐波能量比的方法46-47
- 4.3.3 基于特征组合的方法47-49
- 4.3.4 结果分析及比较49-52
- 4.4 本章小结52-53
- 第5章 总结与展望53-55
- 5.1 主要研究工作与总结53-54
- 5.2 工作展望54-55
- 参考文献55-60
- 致谢60-61
- 附件61
【共引文献】
中国硕士学位论文全文数据库 前1条
1 陈雪梅;乐音信号的多基频估计[D];山东大学;2014年
本文关键词:复合音乐中歌声旋律的提取,由笔耕文化传播整理发布。
本文编号:321009
本文链接:https://www.wllwen.com/kejilunwen/wltx/321009.html