情感语音的非线性特征研究
本文关键词:情感语音的非线性特征研究,由笔耕文化传播整理发布。
【摘要】:情感语音识别已经成为人机交互的重要研究领域之一。通过感知情感状态,计算机可以对人类的行为进行简单地认知并采用更为人性化的方式进行交流,拓展了人机交互的更多可能性。情感语音识别是通过计算机手段从说话人的语音信号中识别出情感状态。鉴于富含情感的沟通对社会关系的重要性,情感语音识别在人机对话、情感计算、心理和精神疾病诊断等方面都有日趋广泛的应用潜力。由于情感的多模态性和自发性,以及情感理论相关研究的滞后性等多种原因的存在,仍然没有建立起完全成熟的情感识别系统。结合当前的情感语音识别研究状况与实际需要,本文首先对情感语音数据库、特征提取以及识别网络部分三个部分分别进行介绍,然后重点对情感语音特征提取的方法和手段进行详尽的研究和论述,提出了基于语音发声机理混沌特性的新非线性特征,实验证明了本文提取的非线性特征弥补了以往提取的特征不足之处。主要的研究内容包括如下部分:(1)介绍了情感语音识别的基础知识,包括常用的数据库、特征提取和识别网络。针对常用的情感特征(韵律特征、基于谱的特征、音质特征和TEO能量算子)和识别网络展开了理论简介。介绍了语音发声和传播过程中体现出的非线性特性,接着采用非线性动力学理论分析方法,从功率谱分析、主分量分析、相空间重构三个方面验证了情感语音是具有混沌特性的。(2)在验证了情感语音信号的混沌特性的基础上,将情感语音信号看作一维时间学列,采用时间序列分析方法实现情感语音的高维状态空间的重构,为进一步提取基于情感语音混沌特性的非线性特征做准备。为了实现情感语音的高维空间重构,本文分别采用邻接误差法、平均互信息法以及C-C方法得到一维情感语音信号相空间重构需要的嵌入维数和延时时间两个参数,为非线性分析方法提取情感语音非线性新特征提供了条件。(3)提出将情感语音信号处理与非线性动力学模型相结合的方法并仿真实现了基于情感语音混沌特性的非线性特征提取。这些特征包括最小延迟时间、关联维数、Kolmogorov熵、最大Lyapunov指数和以及用于描述时间序列相关性的Hurst指数特征,并对上述的非线性特征与情感区分能力之间的关联性进行了定性分析,通过实验验证了基于混沌特性的语音情感非线性特征可以作为语音情感区分的有效的新特征量。(4)利用基于混沌特性的情感语音非线性特征进行了情感语音识别。首先选择在公开的Berlin语音数据库和自建的离散情感语料库TYUT2.0作为实验备选数据库,然后分别提取了韵律学特征、MFCCs和非线性特征及其对应的统计特征,其次对语音情感非线性特征、韵律学特征和MFCCs的性能定性分析,确定了非线性特征是区分语音情感的有效特征;最后分别使用上述三类特征的不同特征融合作为识别系统的输入。通过识别率对比,验证了融合非线性特征后的系统识别性能有了较为显著的改善。
【关键词】:情感语音识别 混沌特性 非线性特征 支持向量机
【学位授予单位】:太原理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3
【目录】:
- 摘要3-5
- ABSTRACT5-10
- 第一章 绪论10-16
- 1.1 研究背景和意义10-11
- 1.2 研究现状11-13
- 1.2.1 语音情感识别研究现状11-13
- 1.3 语音情感识别存在问题13-14
- 1.4 研究内容与论文安排14-16
- 第二章 情感语音识别系统16-28
- 2.1 情感语音数据库16-17
- 2.2 情感语音特征提取17-22
- 2.2.1 韵律特征18-19
- 2.2.2 基于谱的特征19-21
- 2.2.3 音质特征21
- 2.2.4 TEO能量算子21-22
- 2.3 情感语音融合特征22-23
- 2.4 情感语音识别网络23-26
- 2.4.1 支持向量机23-24
- 2.4.2 隐马尔科夫模型24-25
- 2.4.3 高斯混合模型25-26
- 2.4.4 模糊认知图26
- 2.5 本章小结26-28
- 第三章 情感语音的混沌特性研究28-44
- 3.1 语音的混沌特性28-30
- 3.2 情感语音信号的混沌特性30-37
- 3.2.1 功率谱方法30-31
- 3.2.2 情感语音信号的主分量分析31-32
- 3.2.3 情感语音信号的相空间重构32-37
- 3.3 情感语音混沌特征量37-40
- 3.3.1 关联维数37-38
- 3.3.2 Kolmogorov熵38
- 3.3.3 最大Lyapunov指数38-40
- 3.4 Hurst指数40-41
- 3.5 本章小结41-44
- 第四章 基于混沌特性的情感语音识别44-56
- 4.1 情感语音数据库处理44
- 4.2 情感语音信号预处理44-45
- 4.3 情感语音特性的提取45
- 4.4 基于混沌特性的情感语音识别实验45-52
- 4.4.1 最小延迟时间特征在情感语音识别中的应用45-46
- 4.4.2 关联维数特征在情感语音识别中的应用46-47
- 4.4.3 Kolmogorov熵特征在情感语音识别中的应用47
- 4.4.4 最大Lyapunov指数特征在情感语音识别中的应用47-48
- 4.4.5 Hurst指数特征在情感语音识别中的应用48-49
- 4.4.6 混沌非线性特征在情感语音识别中的应用49-52
- 4.5 基于融合特征的情感语音识别实验52-55
- 4.6 本章小结55-56
- 第五章 总结与展望56-60
- 5.1 研究总结56-57
- 5.2 工作展望57-60
- 参考文献60-65
- 致谢65-66
- 攻读学位期间发表的学术论文目录66
【相似文献】
中国期刊全文数据库 前10条
1 夏金祥;范平志;;基于次用户协作的主用户频谱洞周期稳态特征检测[J];电路与系统学报;2009年03期
2 潘广林;梁彦;金术玲;潘泉;程咏梅;;基于子束变换的自适应线性特征检测[J];火力与指挥控制;2008年10期
3 刘伟;纪玉波;;一种改进的人眼特征检测方法[J];辽宁石油化工大学学报;2010年03期
4 张宝政;;基于实时击键特征检测的游戏禁止算法研究[J];信息安全与技术;2012年09期
5 黄志武;张锐;;基于近红外光和可变形模板的人眼特征检测方法[J];电脑知识与技术;2008年07期
6 黄家m:;郑日荣;曾绳涛;;心电信号特征检测算法研究[J];机电工程技术;2013年08期
7 陈伟;孙勇;杨义先;钮心忻;;面向特征的信息隐藏检测研究[J];计算机系统应用;2006年03期
8 杨恒;王庆;;一种新的局部不变特征检测和描述算法[J];计算机学报;2010年05期
9 范虹;孟庆丰;张优云;高强;;基于三阶累积量对角切片的信号特征检测[J];计算机工程与应用;2006年36期
10 吴训威,卢仰坚,夏银水;三值序列的特征检测及其产生[J];浙江大学学报(理学版);2001年04期
中国重要会议论文全文数据库 前1条
1 吕尧新;刘志强;朱祥华;;基于相位一致性原理的图像特征检测技术[A];第九届全国青年通信学术会议论文集[C];2004年
中国重要报纸全文数据库 前1条
1 ;IDS的演变[N];网络世界;2004年
中国博士学位论文全文数据库 前4条
1 徐政五;基于太赫兹雷达的人体心跳和微动特征检测方法研究[D];电子科技大学;2014年
2 王建辉;实时视觉特征检测与匹配硬件架构研究[D];华中科技大学;2015年
3 钟清流;时序、图像特征检测的理论、方法及应用研究[D];中南大学;2008年
4 杜刚;新闻数据中突发话题检测研究[D];北京邮电大学;2012年
中国硕士学位论文全文数据库 前10条
1 常旭剑;基于FAST检测及SIFT描述的特征检测算法[D];中北大学;2015年
2 许可乐;图像局部不变特征检测与描述技术研究[D];国防科学技术大学;2013年
3 周圣焱;面向光学生物传感器的海量光谱信号特征检测系统[D];上海交通大学;2015年
4 宋恺珉;基于统计特征的网络入侵检测技术研究[D];南京邮电大学;2015年
5 姚慧;情感语音的非线性特征研究[D];太原理工大学;2016年
6 姜艳;对基于点表示的物体进行绘制和特征检测的技术的研究与实现[D];吉林大学;2008年
7 冯小平;基于高光谱成像技术的血迹形态特征检测研究[D];重庆理工大学;2013年
8 刘传静;三角网格曲面的分级特征检测算法研究[D];大连理工大学;2006年
9 杨云英;仿射不变特征检测算法性能分析[D];山西大学;2012年
10 吕思凡;人脸皮肤图像特征检测[D];北京交通大学;2008年
本文关键词:情感语音的非线性特征研究,由笔耕文化传播整理发布。
,本文编号:382687
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/382687.html