基于语谱图特征的语音情感识别研究
本文选题:语谱图 + Gabor滤波器 ; 参考:《太原理工大学》2017年硕士论文
【摘要】:目前,在语音情感识别领域,研究者经常选用的情感语音特征有音质特征、频域特征、时域特征等特征,而关注语音时域-频域相关性的研究则相对较少,发展较晚。本文利用语谱图反映语音时域-频域相关性的特点,提取语谱图多种不同的纹理特征,将所提特征应用于语音情感识别。通过实验分析,部分语谱图纹理特征取得了比较好识别率,验证了基于语谱图特征的语音情感识别方法的可行性。本文主要以语谱图为基础对语谱图纹理特征的提取和分类进行了研究,主要完成的工作包含以下几部分:(1)介绍了语音情感研究的背景、意义、发展现状以及常用的图像纹理特征提取方法和纹理特征分类方法。(2)利用Gabor小波分别结合灰度共生矩阵方法、Tamura方法、局部二值模式(LBP)方法提取语谱图特征。(3)提出了改进的局部二值模式方法、融合语谱图LBP特征和局部Hu矩特征方法,并以柏林语音库为基础进行情感语音识别,实验结果显示不同情感的综合识别率有了比较明显的提升。(4)实现了支持向量机和K近邻分类方法对所提特征进行分类识别,并研究了语谱图灰度共生矩阵特征、Tamura特征、LBP特征、改进的LBP特征、融合LBP特征与局部Hu距特征的情感识别效果,以及融合特征权值对识别率的影响。经过比较不同方法下的识别率,改进后的LBP方法与融合语谱图LBP特征与局部Hu距特征方法取得了较好的实验结果。
[Abstract]:At present, in the field of speech emotion recognition, researchers often choose affective speech features, such as phonological characteristics, frequency domain features, time domain features, etc. However, the research on the correlation between speech time domain and frequency domain is relatively few, and the development is relatively late.In this paper, the feature of correlation between speech time domain and frequency domain is reflected in the speech spectrum, and different texture features are extracted from the spectrum map, and the proposed features are applied to speech emotion recognition.Through experimental analysis, some of the texture features of spectral images have achieved a good recognition rate, which verifies the feasibility of the speech emotion recognition method based on the spectral image features.In this paper, the extraction and classification of texture features are studied on the basis of spectrogram. The main work includes the following parts: 1) introduce the background and significance of speech affective research.The current situation and the common methods of image texture feature extraction and texture feature classification. (2) using Gabor wavelet and gray level co-occurrence matrix method, respectively, Tamura method is used.This paper presents an improved local binary pattern method, which combines LBP features with local Hu moments features, and implements emotional speech recognition on the basis of Berlin phonetic corpus.The experimental results show that the comprehensive recognition rate of different emotions is significantly improved. (4) support vector machine and K-nearest neighbor classification method are used to classify and recognize the proposed features, and the gray level co-occurrence matrix feature Tamura feature and LBP feature of the spectral image are studied.The improved LBP feature, the emotion recognition effect of fusion LBP feature and local Hu distance feature, and the influence of fusion feature weight on recognition rate.By comparing the recognition rates of different methods, the improved LBP method, the fusion spectral LBP feature and the local Hu distance feature method have obtained good experimental results.
【学位授予单位】:太原理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.34
【相似文献】
相关期刊论文 前10条
1 林奕琳;韦岗;杨康才;;语音情感识别的研究进展[J];电路与系统学报;2007年01期
2 赵力;黄程韦;;实用语音情感识别中的若干关键技术[J];数据采集与处理;2014年02期
3 陈建厦,李翠华;语音情感识别的研究进展[J];计算机工程;2005年13期
4 王茜;;一个语音情感识别系统的设计与实现[J];大众科技;2006年08期
5 孙亚;;远程教学中语音情感识别系统的研究与实现[J];长春理工大学学报(高教版);2008年02期
6 章国宝;宋清华;费树岷;赵艳;;语音情感识别研究[J];计算机技术与发展;2009年01期
7 石瑛;胡学钢;方磊;;基于决策树的多特征语音情感识别[J];计算机技术与发展;2009年01期
8 赵腊生;张强;魏小鹏;;语音情感识别研究进展[J];计算机应用研究;2009年02期
9 张石清;赵知劲;;噪声背景下的语音情感识别[J];西南交通大学学报;2009年03期
10 黄程韦;金峗;王青云;赵艳;赵力;;基于特征空间分解与融合的语音情感识别[J];信号处理;2010年06期
相关会议论文 前8条
1 陈建厦;;语音情感识别综述[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年
2 杨桃香;杨鉴;毕福昆;;基于模糊聚类的语音情感识别[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
3 罗武骏;包永强;赵力;;基于模糊支持向量机的语音情感识别方法[A];2012'中国西部声学学术交流会论文集(Ⅱ)[C];2012年
4 王青;谢波;陈根才;;基于神经网络的汉语语音情感识别[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年
5 张鼎天;徐明星;;基于调制频谱特征的自动语音情感识别[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
6 童灿;;基于boosting HMM的语音情感识别[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
7 戴明洋;杨大利;徐明星;;语音情感识别中UBM训练集的组成研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 张卫;张雪英;孙颖;;基于HHT边际Teager能量谱的语音情感识别[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
相关博士学位论文 前7条
1 孙亚新;语音情感识别中的特征提取与识别算法研究[D];华南理工大学;2015年
2 王坤侠;语音情感识别方法研究[D];合肥工业大学;2015年
3 韩文静;语音情感识别关键技术研究[D];哈尔滨工业大学;2013年
4 谢波;普通话语音情感识别关键技术研究[D];浙江大学;2006年
5 尤鸣宇;语音情感识别的关键技术研究[D];浙江大学;2007年
6 刘佳;语音情感识别的研究与应用[D];浙江大学;2009年
7 赵腊生;语音情感特征提取与识别方法研究[D];大连理工大学;2010年
相关硕士学位论文 前10条
1 陈晓东;基于卷积神经网络的语音情感识别[D];华南理工大学;2015年
2 孙志锋;语音情感识别研究[D];陕西师范大学;2015年
3 谭发曾;语音情感状态模糊识别研究[D];电子科技大学;2015年
4 陈鑫;相空间重构在语音情感识别中的研究[D];长沙理工大学;2014年
5 李昌群;基于特征选择的语音情感识别[D];合肥工业大学;2015年
6 陈文汐;基于核函数的语音情感识别技术的研究[D];东南大学;2015年
7 薛文韬;基于深度学习和迁移学习的语音情感识别方法研究[D];江苏大学;2016年
8 宋明虎;电力行业电话电话客服语音情感识别[D];昆明理工大学;2016年
9 陈肖;基于多粒度特征融合的维度语音情感识别方法研究[D];哈尔滨工业大学;2016年
10 任浩;基于多级分类的语音情感识别[D];哈尔滨工业大学;2016年
,本文编号:1743106
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1743106.html