基于HMM和人工神经网络混合模型的汉语语音情感识别
发布时间:2017-04-21 15:05
本文关键词:基于HMM和人工神经网络混合模型的汉语语音情感识别,,由笔耕文化传播整理发布。
【摘要】:随着人机交互技术的发展,语音的情感识别已经逐渐成为模式识别领域研究的热点之一。随着研究的不断深入,当单独使用HMM和人工神经网络来对语音情感状态进行分类识别时,效果并不是很理想。本文将HMM和人工神经网络两种算法进行融合,取长补短,形成新的混合模型,进而提高系统的识别率。该识别技术在服务机器人、语音自动应答系统等方面具有应用价值。本文对语音情感识别的发展现状进行了分析,对汉语语音情感识别的问题进行了深入的研究。首先,针对目前汉语语音情感识别在建立汉语语音情感数据库时存在很多困难的问题,对语音情感的基础理论以及建立汉语语音情感数据库的原则进行了详细的阐述。然后,为了减少语音信号本身对识别效果的影响,提出了基于GA-SVM的语音端点检测方法并对汉语语音的情感特征进行了统计分析,形成了一个30维的特征向量。针对目前单一的HMM和人工神经网络模型存在的缺陷,提出了将HMM和人工神经网络混合模型应用于汉语语音情感状态的分类识别。该模型首先由HMM产生情感语音信号的最佳状态序列,然后利用时间规整算法对同一状态的特征参数进行规整得到等维的特征向量,并将它作为人工神经网络的输入进行语音情感状态识别。该算法充分利用了HMM极强的动态时序建模能力以及人工神经网络强大的分类能力。最后,以Matlab2012a为工作平台进行编程仿真。实现了HMM和人工神经网络两种模型的结合。并将混合模型分别与HMM和人工神经网络模型进行对比。实验结果表明,HMM和人工神经网络混合模型提高了汉语语音情感识别系统的识别准确率。此外,混合模型在不同信噪比的条件下也体现出了它的优势。
【关键词】:HMM 人工神经网络 汉语语音情感识别 语音端点检测 情感特征 HMM和人工神经网络混合模型
【学位授予单位】:湖南师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP183;TN912.34
【目录】:
- 摘要4-6
- Abstract6-12
- 1 绪论12-17
- 1.1 研究背景12
- 1.2 语音情感识别的研究现状12-14
- 1.2.1 国际研究现状13
- 1.2.2 国内研究现状13-14
- 1.3 语音情感识别的应用前景14-15
- 1.4 本文的研究内容与结构15-17
- 1.4.1 论文的主要研究内容15-16
- 1.4.2 论文的结构安排16-17
- 2 语音情感理论基础17-24
- 2.1 语音情感的定义17
- 2.2 语音情感的分类17-20
- 2.2.1 基本情感论和调色板情感论18-19
- 2.2.2 情感维度空间论19-20
- 2.3 情感语音数据库20-23
- 2.3.1 建立情感语音数据库的原则21-22
- 2.3.2 典型的情感语音数据库22-23
- 2.3.3 本文的普通话情感语音数据库23
- 2.4 本章小结23-24
- 3 语音信号的处理24-38
- 3.1 语音信号的预处理24
- 3.2 基于GA-SVM的端点检测方法24-31
- 3.2.1 端点检测的特征向量26
- 3.2.2 SVM分类器算法26-28
- 3.2.3 遗传算法优化SVM参数28-31
- 3.2.4 语音端点检测ki骤31
- 3.3 语音情感特征分析31-37
- 3.3.1 短时能量32-33
- 3.3.2 梅尔频率倒谱系数33
- 3.3.3 基因频率33-35
- 3.3.4 共振峰35-36
- 3.3.5 语音情感识别的特征向量36-37
- 3.4 本章小结37-38
- 4 HMM和人工神经网络混合模型的设计38-53
- 4.1 隐马尔可夫模型38-43
- 4.1.1 HMM的定义38-39
- 4.1.2 HMM模型的基本算法39-42
- 4.1.3 HMM模型的优缺点42-43
- 4.2 人工神经网络43-46
- 4.2.1 人工神经网络的概述43-44
- 4.2.2 概率神经网络44-46
- 4.2.3 概率神经网络的优缺点46
- 4.3 HMM和人工神经网络的混合模型46-47
- 4.3.1 HMM和人工神经网络结合的理论依据46
- 4.3.2 HMM和人工神经网络混合模型的结合方式46-47
- 4.4 HMM和人工神经网络混合模型的实现47-51
- 4.4.1 HMM和人工神经网络混合模型的结构47-48
- 4.4.2 HMM和人工神经网络混合模型的训练48-50
- 4.4.3 HMM和人工神经网络混合模型的识别50-51
- 4.5 本章小结51-53
- 5 仿真实验和结果分析53-60
- 5.1 仿真环境与数据来源53
- 5.2 端点检测53-55
- 5.2.1 遗传算法搜索SVM最优参数实验53-54
- 5.2.2 语音端点检测实验54-55
- 5.3 情感语音信号的特征提取55-57
- 5.4 系统性能评估57-59
- 5.4.1 识别率的比较57-58
- 5.4.2 算法速度比较58
- 5.4.3 噪声环境下系统的性能58-59
- 5.5 本章小结59-60
- 6 总结与展望60-62
- 6.1 总结60
- 6.2 展望60-62
- 参考文献62-67
- 附录67-68
- 致谢68
【参考文献】
中国期刊全文数据库 前4条
1 王艳芬,于洪珍,刘卫东,郑晓红;基于时域自相关平方函数的基音周期估计[J];计算机工程与应用;2004年31期
2 李书玲;刘蓉;张鎏钦;刘红;;基于改进型SVM算法的语音情感识别[J];计算机应用;2013年07期
3 汪海燕;黎建辉;杨风雷;;支持向量机理论及算法研究综述[J];计算机应用研究;2014年05期
4 赵力;黄程韦;;实用语音情感识别中的若干关键技术[J];数据采集与处理;2014年02期
中国硕士学位论文全文数据库 前1条
1 王明;基于神经网络的语音识别技术研究与实现[D];电子科技大学;2012年
本文关键词:基于HMM和人工神经网络混合模型的汉语语音情感识别,由笔耕文化传播整理发布。
本文编号:320583
本文链接:https://www.wllwen.com/kejilunwen/wltx/320583.html