基于张量分解的音频信号分类研究
发布时间:2023-01-07 09:04
随着多媒体和互联网技术的不断进步与发展,音频信号作为多媒体信号的重要组成成分,对其进行信息处理与挖掘受到越来越多研究者的青睐,而处理这些音频信号的方法也多种多样。网络的普及使我们在大量音频信息中选取有用信息时,可以将那些无用的以及影响研究者完成音频分类的信息革除,这样不仅节省了人力资源,还可以更加有效便捷的提取有用信息而屏蔽多余的信息。因此在这个信息杂糅的时代,音频分类技术大有可为。在人工智能及大数据分析的背景下,图像音频等领域展现出了较为光明的前景,而音频场景分类逐渐成为广大研究者们所钟爱的方向。音频场景分类是通过音频标签信息进行分析。给出音频场景,其中包含各种各样的音频信号,相较于之前的单一的摄像头进行场景分类,利用音频技术不需要考虑大雾大雨这样恶劣的天气因素,且利用音频技术采集的过程中也不会存在视频监控那样的死角问题。音频分类只需要一个采集声音的设备和一个接收的设备,视频监控如果能结合音频技术使得我们在今后的生产生活有一定的积极影响,使得我们会在场景分类这一领域有更加广阔的发展空间。本课题面对一系列的分类问题,利用张量分析构建音频张量,之后再进行张量分解,这样就能得到鲁棒性较强的...
【文章页数】:48 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状和进展分析
1.2.1 研究现状
1.2.2 应用进展
1.3 论文的主要内容
1.4 论文组织结构
2 音频场景分类系统介绍
2.1 音频系统结构简介
2.2 音频分类相关内容
2.2.1 应用场景及优势
2.2.2 特征提取
2.2.3 分类器的训练
2.3 SVM模型
2.3.1 SVM二分类问题
2.3.2 SVM多分类问题
2.4 本章小结
3 音频信号特征提取
3.1 音频特征
3.1.1 时域特征
3.1.2 频域特征
3.1.3 时频域特征
3.1.4 倒谱特征
3.2 常用的音频特征提取
3.2.1 分类常用特征介绍
3.2.2 MFCC特征提取的流程
3.3 本章小结
4 张量的相关原理
4.1 张量的概念
4.2 张量的相关运算
4.2.1 张量的纤维束与切片
4.2.2 张量的矩阵化
4.2.3 张量间的运算
4.3 张量分解
4.3.1 张量的CP分解
4.3.2 Tucker分解
4.4 本章小节
5 实验及结果分析
5.1 实验流程设计
5.1.1 音频数据集
5.1.2 实验环境及配置
5.1.3 实验设计
5.2 实验结果分析
5.3 本章小结
结论
参考文献
在学研究成果
致谢
本文编号:3728357
【文章页数】:48 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状和进展分析
1.2.1 研究现状
1.2.2 应用进展
1.3 论文的主要内容
1.4 论文组织结构
2 音频场景分类系统介绍
2.1 音频系统结构简介
2.2 音频分类相关内容
2.2.1 应用场景及优势
2.2.2 特征提取
2.2.3 分类器的训练
2.3 SVM模型
2.3.1 SVM二分类问题
2.3.2 SVM多分类问题
2.4 本章小结
3 音频信号特征提取
3.1 音频特征
3.1.1 时域特征
3.1.2 频域特征
3.1.3 时频域特征
3.1.4 倒谱特征
3.2 常用的音频特征提取
3.2.1 分类常用特征介绍
3.2.2 MFCC特征提取的流程
3.3 本章小结
4 张量的相关原理
4.1 张量的概念
4.2 张量的相关运算
4.2.1 张量的纤维束与切片
4.2.2 张量的矩阵化
4.2.3 张量间的运算
4.3 张量分解
4.3.1 张量的CP分解
4.3.2 Tucker分解
4.4 本章小节
5 实验及结果分析
5.1 实验流程设计
5.1.1 音频数据集
5.1.2 实验环境及配置
5.1.3 实验设计
5.2 实验结果分析
5.3 本章小结
结论
参考文献
在学研究成果
致谢
本文编号:3728357
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3728357.html