基于神经网络的语音情感识别算法研究
发布时间:2023-03-18 21:37
在计算机技术领域,未来的目标将是减少人与机器的沟通障碍。提取信号中蕴含的情感特征来判断情绪波动的语音情感研究已成为一个很有发展潜力的研究课题。结合语音情感识别的广泛需求,本文研究了基于神经网络的语音情感识别算法。具体研究内容如下:提取了四种不同情感的语音特征。四种不同情感为生气、害怕、快乐和伤心。首先提取了语速、短时平均能量、短时平均过零率和基音频率四个韵律学特征;然后提取了音质特征共振峰;最后提取了基于谱的相关特征梅尔频率倒谱系数。研究了基于BP神经网络的语音情感识别算法。首先对BP神经网络进行训练,其中输入为不同语音特征组成的行向量,最后对不同情感类别的语音进行识别。基于BP神经网络的语音情感识别实验主要从迭代训练次数、学习率、隐含层神经元个数、样本集个数、不同特征组合和情感种类数六个方面展开。实验结果表明:当对四种不同的情感两两组合时,语音情感识别率在65.85%到91.00%之间;本文对四种不同情感的识别率比选用支持向量机算法提高了5.47%。研究了基于卷积神经网络的语音情感识别算法。首先对卷积神经网络进行训练,其中特征输入为一个梅尔频率倒谱系数情感特征组成的矩阵,最终对不同情...
【文章页数】:91 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
1.1 课题研究背景和意义
1.2 国内外研究现状
1.3 本文研究内容及章节安排
第二章 语音情感识别的基本理论
2.1 语音情感研究的基本流程
2.2 情感理论
2.2.1 情绪的有限状态集和维度空间
2.2.2 语音情感理论
2.2.3 语音情感语料库简介
2.3 语音信号预处理
2.3.1 语音信号预加重
2.3.2 语音信号分帧和加窗
2.4 语音特征分类
2.5 语音情感分类器
2.6 本章小结
第三章 语音情感特征的分析及提取
3.1 语音韵律学情感特征的分析及提取
3.2 语音音质情感特征的分析及提取
3.3 语音谱相关情感特征的分析及提取
3.4 语音特征的统计学参数
3.5 本章小结
第四章 基于BP神经网络的语音情感识别算法研究
4.1 BP神经网络基础
4.1.1 BP神经网络的基本原理
4.1.2 BP神经网络的数学表达
4.1.3 BP神经网络的训练步骤
4.2 BP神经网络算法用于语音情感识别的方案设计
4.2.1 BP神经网络算法的特征输入
4.2.2 BP神经网络算法的参数设置
4.3 基于BP神经网络的语音情感识别实验
4.3.1 迭代训练次数对BP神经网络识别性能的影响
4.3.2 学习率对BP神经网络识别性能的影响
4.3.3 隐含层神经元个数对BP神经网络识别性能的影响
4.3.4 样本集个数对语音情感识别率的影响
4.3.5 不同特征组合的BP神经网络识别率比较
4.3.6 情感种类对BP神经网络识别率的影响
4.3.7 实验分析
4.4 本章小结
第五章 基于卷积神经网络的语音情感识别算法研究
5.1 卷积神经网络实验工具简介
5.2 卷积神经网络的基本理论
5.2.1 卷积神经网络的基本结构
5.2.2 卷积神经网络的求解和训练过程
5.3 卷积神经网络算法用于语音情感识别的方案设计
5.3.1 卷积神经网络算法的特征输入
5.3.2 卷积神经网络算法的参数设置
5.3.3 卷积神经网络算法的网络结构设计
5.4 基于卷积神经网络的语音情感识别实验
5.4.1 卷积神经网络算法的训练过程
5.4.2 情感种类对卷积神经网络识别率的影响
5.4.3 训练集个数对情感识别率的影响
5.4.4 卷积神经网络和BP神经网络两种语音情感识别算法比较
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
作者简介
本文编号:3763916
【文章页数】:91 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
1.1 课题研究背景和意义
1.2 国内外研究现状
1.3 本文研究内容及章节安排
第二章 语音情感识别的基本理论
2.1 语音情感研究的基本流程
2.2 情感理论
2.2.1 情绪的有限状态集和维度空间
2.2.2 语音情感理论
2.2.3 语音情感语料库简介
2.3 语音信号预处理
2.3.1 语音信号预加重
2.3.2 语音信号分帧和加窗
2.4 语音特征分类
2.5 语音情感分类器
2.6 本章小结
第三章 语音情感特征的分析及提取
3.1 语音韵律学情感特征的分析及提取
3.2 语音音质情感特征的分析及提取
3.3 语音谱相关情感特征的分析及提取
3.4 语音特征的统计学参数
3.5 本章小结
第四章 基于BP神经网络的语音情感识别算法研究
4.1 BP神经网络基础
4.1.1 BP神经网络的基本原理
4.1.2 BP神经网络的数学表达
4.1.3 BP神经网络的训练步骤
4.2 BP神经网络算法用于语音情感识别的方案设计
4.2.1 BP神经网络算法的特征输入
4.2.2 BP神经网络算法的参数设置
4.3 基于BP神经网络的语音情感识别实验
4.3.1 迭代训练次数对BP神经网络识别性能的影响
4.3.2 学习率对BP神经网络识别性能的影响
4.3.3 隐含层神经元个数对BP神经网络识别性能的影响
4.3.4 样本集个数对语音情感识别率的影响
4.3.5 不同特征组合的BP神经网络识别率比较
4.3.6 情感种类对BP神经网络识别率的影响
4.3.7 实验分析
4.4 本章小结
第五章 基于卷积神经网络的语音情感识别算法研究
5.1 卷积神经网络实验工具简介
5.2 卷积神经网络的基本理论
5.2.1 卷积神经网络的基本结构
5.2.2 卷积神经网络的求解和训练过程
5.3 卷积神经网络算法用于语音情感识别的方案设计
5.3.1 卷积神经网络算法的特征输入
5.3.2 卷积神经网络算法的参数设置
5.3.3 卷积神经网络算法的网络结构设计
5.4 基于卷积神经网络的语音情感识别实验
5.4.1 卷积神经网络算法的训练过程
5.4.2 情感种类对卷积神经网络识别率的影响
5.4.3 训练集个数对情感识别率的影响
5.4.4 卷积神经网络和BP神经网络两种语音情感识别算法比较
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
作者简介
本文编号:3763916
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3763916.html