基于特征筛选和决策树SVM的语音情感识别技术研究
发布时间:2023-05-11 02:45
语音作为人类日常生活交流的主要方式,承载着说话人丰富的情感信息。真正意义上的人工智能需要机器从情感层面充分理解人类的意图,因此语音情感识别在未来的人工智能领域具有广阔的应用前景。目前,在语音情感识别的基本框架下,寻找一种具有高区分度的语音情感特征和构建高效的识别模型是当今研究的热点问题,它们的好坏直接影响着整个系统的识别效果。本文针对多种情感识别的情况,从特征参数和模型两个方面出发,提出了基于特征筛选和决策树SVM的语音情感识别方法以及基于DNN-决策树SVM的语音情感识别方法。本文的主要研究工作如下:(1)通过对语音情感识别的研究背景以及研究现状的充分学习,熟练掌握了语音情感识别的基本框架以及常用的识别方法。本文介绍了语音情感识别领域中的常用语料库、语音预处理技术以及常用的特征参数,并分析了各类特征参数的特性。除此之外,本文还介绍了特征参数的统计变量计算方法以及归一化方法,为后续的研究工作打下了扎实的基础。(2)在多种情感的识别任务中,由于情感间的混淆度增大而导致系统的整体识别率降低。针对此问题,本文提出了Fisher特征筛选决策树支持向量机(SVM)模型的语音情感识别方法。该方法首...
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
专用术语注释表
第一章 绪论
1.1 研究背景
1.2 研究现状
1.3 本文研究内容与安排
第二章 语音情感识别技术概述
2.1 语音情感识别系统的基本结构
2.2 常用的情感语料库
2.2.1 离散情感语料库
2.2.2 维度情感语料库
2.3 语音信号的预处理技术
2.3.1 预加重
2.3.2 分帧与加窗
2.3.3 端点检测
2.4 语音情感识别中的常用特征参数
2.4.1 能量
2.4.2 短时过零率
2.4.3 基音频率
2.4.4 梅尔倒谱系数
2.4.5 傅里叶系数
2.5 统计特性
2.6 归一化方法
2.7 本章小结
第三章 基于特征筛选决策树SVM的语音情感识别
3.1 引言
3.2 支持向量机
3.3 决策树SVM的构建策略
3.4 SVM参数寻优算法
3.4.1 粒子群优化算法
3.4.2 遗传算法
3.5 特征筛选方法
3.5.1 主成分分析法
3.5.2 Fisher判决准则
3.6 基于特征筛选决策树SVM模型的构建
3.7 实验仿真与结果分析
3.7.1 实验语料库及实验环境
3.7.2 特征参数筛选及维数选择
3.7.3 本章方法与其他方法的性能比较
3.7.4 SVM参数对识别性能的影响
3.8 本章小结
第四章 基于DNN-决策树SVM的语音情感识别系统
4.1 引言
4.2 深度学习发展史
4.3 深度学习理论基础
4.3.1 基于RBM的预训练
4.3.2 精细调整
4.4 深度神经网络的参数说明
4.4.1 预处理方式
4.4.2 批量块大小的选择
4.4.3 学习速率
4.4.4 网络结构
4.5 提取瓶颈特征的DNN网络
4.6 基于DNN-决策树SVM的语音情感识别系统
4.7 实验仿真与结果分析
4.7.1 实验数据及实验环境
4.7.2 不同网络参数值的对比实验
4.7.3 瓶颈层特征与传统特征的对比实验
4.7.4 DNN-SVM网络与DNN-决策树SVM网络的对比实验
4.8 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
附录1 攻读硕士学位期间撰写的论文
附录2 攻读硕士学位期间参加的科研项目
致谢
本文编号:3814000
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
专用术语注释表
第一章 绪论
1.1 研究背景
1.2 研究现状
1.3 本文研究内容与安排
第二章 语音情感识别技术概述
2.1 语音情感识别系统的基本结构
2.2 常用的情感语料库
2.2.1 离散情感语料库
2.2.2 维度情感语料库
2.3 语音信号的预处理技术
2.3.1 预加重
2.3.2 分帧与加窗
2.3.3 端点检测
2.4 语音情感识别中的常用特征参数
2.4.1 能量
2.4.2 短时过零率
2.4.3 基音频率
2.4.4 梅尔倒谱系数
2.4.5 傅里叶系数
2.5 统计特性
2.6 归一化方法
2.7 本章小结
第三章 基于特征筛选决策树SVM的语音情感识别
3.1 引言
3.2 支持向量机
3.3 决策树SVM的构建策略
3.4 SVM参数寻优算法
3.4.1 粒子群优化算法
3.4.2 遗传算法
3.5 特征筛选方法
3.5.1 主成分分析法
3.5.2 Fisher判决准则
3.6 基于特征筛选决策树SVM模型的构建
3.7 实验仿真与结果分析
3.7.1 实验语料库及实验环境
3.7.2 特征参数筛选及维数选择
3.7.3 本章方法与其他方法的性能比较
3.7.4 SVM参数对识别性能的影响
3.8 本章小结
第四章 基于DNN-决策树SVM的语音情感识别系统
4.1 引言
4.2 深度学习发展史
4.3 深度学习理论基础
4.3.1 基于RBM的预训练
4.3.2 精细调整
4.4 深度神经网络的参数说明
4.4.1 预处理方式
4.4.2 批量块大小的选择
4.4.3 学习速率
4.4.4 网络结构
4.5 提取瓶颈特征的DNN网络
4.6 基于DNN-决策树SVM的语音情感识别系统
4.7 实验仿真与结果分析
4.7.1 实验数据及实验环境
4.7.2 不同网络参数值的对比实验
4.7.3 瓶颈层特征与传统特征的对比实验
4.7.4 DNN-SVM网络与DNN-决策树SVM网络的对比实验
4.8 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
附录1 攻读硕士学位期间撰写的论文
附录2 攻读硕士学位期间参加的科研项目
致谢
本文编号:3814000
本文链接:https://www.wllwen.com/kejilunwen/wltx/3814000.html