基于节拍和关键背景模型的音频分类与分割
发布时间:2022-01-27 05:46
音频数据分类分割是音频数据处理系统最常用、最重要的预处理技术,显著地影响系统的性能和效果,具有重要的研究价值。在音频样例检索系统中,需要为操作人员提供便捷、高效的样例提取工具,从多媒体文件中截取音频片段,作为查询的样例数据。截取的样例一般是包含操作人员感兴趣、含有重要信息、内容具有一定完整性的片段。尽管音频信息无法快速浏览,但如果在操作人员截取音频样例之前,先使用音频分割分类技术获取音频文件内容的结构化信息,然后采用可视化技术呈现给操作人员,将便于操作人员快速浏览文件内容、便捷、高效地选取音频片段,完成样例制作任务。本文以音频样例提取为应用背景,研究并实现了基于多级分类的音频数据分类与分割算法,并将该算法用于样例提取,提高操作人员工作效率,具体工作如下:(1)采用随机森林算法实现音频的粗分类,将音频数据分为音乐、纯语音、含背景音乐语音、含背景噪音语音和背景音,共五类。采用基于音频段的分割方法实现音频的粗分割,将音频数据分为音乐、语音和背景音三大段。(2)对于音乐类数据,针对操作人员更多关注有歌声音乐而非纯音乐的特点,提出了基于节拍的分类方法,将音乐类数据细分为纯音乐与有歌声音乐两种。实...
【文章来源】:哈尔滨工业大学黑龙江省211工程院校985工程院校
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究目的和意义
1.2 国内外研究现状与分析
1.2.1 音频分类技术的研究进展
1.2.2 音频分割技术的研究进展
1.2.3 目前方法存在的问题
1.3 研究内容和组织结构
第2章 音频分类分割概述
2.1 引言
2.2 音频信号预处理
2.2.1 预加重处理
2.2.2 分帧处理
2.2.3 加窗处理
2.3 特征计算
2.3.1 时域特征
2.3.2 频域特征
2.4 性能评价标准
2.5 本章小结
第3章 基于随机森林的音频多分类
3.1 引言
3.2 基于随机森林的音频分类
3.2.1 随机森林简介
3.2.2 音频分类方法
3.3 基于音频段的音频分割
3.4 实验结果与分析
3.4.1 实验数据与设置
3.4.2 实验结果与分析
3.5 本章小结
第4章 基于节拍的歌唱音乐与纯音乐分类
4.1 引言
4.2 节拍概述
4.3 节拍跟踪
4.3.1 起音包络计算
4.3.2 速度估计
4.3.3 节拍跟踪
4.4 基于节拍的分类方法
4.5 实验结果与分析
4.5.1 实验数据与设置
4.5.2 实验结果与分析
4.6 本章小结
第5章 基于关键背景模型的语音分割
5.1 引言
5.2 GSSG分割方法
5.3 模型训练
5.3.1 模型训练算法
5.3.2 高斯模型距离准则
5.4 GSH特征计算
5.5 聚类算法
5.5.1 簇初始化
5.5.2 聚类算法
5.5.3 最优聚类个数确定
5.6 实验结果与分析
5.6.1 实验数据及设置
5.6.2 实验结果及分析
5.7 本章小结
结论
参考文献
致谢
本文编号:3611884
【文章来源】:哈尔滨工业大学黑龙江省211工程院校985工程院校
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究目的和意义
1.2 国内外研究现状与分析
1.2.1 音频分类技术的研究进展
1.2.2 音频分割技术的研究进展
1.2.3 目前方法存在的问题
1.3 研究内容和组织结构
第2章 音频分类分割概述
2.1 引言
2.2 音频信号预处理
2.2.1 预加重处理
2.2.2 分帧处理
2.2.3 加窗处理
2.3 特征计算
2.3.1 时域特征
2.3.2 频域特征
2.4 性能评价标准
2.5 本章小结
第3章 基于随机森林的音频多分类
3.1 引言
3.2 基于随机森林的音频分类
3.2.1 随机森林简介
3.2.2 音频分类方法
3.3 基于音频段的音频分割
3.4 实验结果与分析
3.4.1 实验数据与设置
3.4.2 实验结果与分析
3.5 本章小结
第4章 基于节拍的歌唱音乐与纯音乐分类
4.1 引言
4.2 节拍概述
4.3 节拍跟踪
4.3.1 起音包络计算
4.3.2 速度估计
4.3.3 节拍跟踪
4.4 基于节拍的分类方法
4.5 实验结果与分析
4.5.1 实验数据与设置
4.5.2 实验结果与分析
4.6 本章小结
第5章 基于关键背景模型的语音分割
5.1 引言
5.2 GSSG分割方法
5.3 模型训练
5.3.1 模型训练算法
5.3.2 高斯模型距离准则
5.4 GSH特征计算
5.5 聚类算法
5.5.1 簇初始化
5.5.2 聚类算法
5.5.3 最优聚类个数确定
5.6 实验结果与分析
5.6.1 实验数据及设置
5.6.2 实验结果及分析
5.7 本章小结
结论
参考文献
致谢
本文编号:3611884
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3611884.html