当前位置:主页 > 科技论文 > 网络通信论文 >

基于安卓的语音情感识别系统设计与实现

发布时间:2020-08-28 05:14
【摘要】:语音情感识别技术是当前情感计算与语音信号领域的热点问题。作为人机交互之中的一个重要组成部分,在疾病诊断、刑侦破案、远程教育等领域也有日趋广泛的应用。作为人机交互之中的一个重要组成部分,语音情感识别技术却由于情感本身的定义不确定性与表征情感的特征的模糊性,使得语音情感识别技术成为了一个难题。为了解决语音情感识别技术中识别率不高且还不能做到人机交互应用的难题,本文主要进行了以下几点研究:1.引入非线性特征Teager能量算子,并将Teager能量算子与MFCC(Mel-Frequency Cepstral Coefficients,梅尔频域倒谱系数)相结合提取NFD_Mel(Nonlinear Frequency Domain Mel,非线性梅尔频域参数),实验结果表明该特征可以从非线性的角度提取特征,并与传统特征相结合可以有效提高识别率,在德国柏林情感数据库识别率达到了82.02%,相比不采用NFD_Mel的传统方法,识别率提高了3.24%。2.我们创新性地提出了一种基于倒谱分离信号的非特定人语音情感识别方法:声门与声道信号都包含了丰富的情感信息,由于个人声道的差异,通常声道信息则更多的包含了个人特征,这对于我们非特定人的情感识别工作产生了很多的干扰。基于非特定人的情感识别效果则不如特定人。为了克服现有技术的不足,我们创新性地提出了一种基于倒谱分离信号的非特定人语音情感识别方法,该方法利用倒谱分离信号,保留全部的声带信息并摒弃一部分的声道信息,同时寻找最佳分离点,最后对处理后的信号在复倒谱重构并提取特征,可以有效提高非特定人语音情感识别率。本文将该方法与人耳听觉效应相结合提出一种新特征CSS-MFCC(Cepstrum separation signal Mel-Frequency Cepstral Coefficients,倒谱分离信号梅尔频域倒谱系数),经实验表明将该特征与传统特征相结合后可以有效提高识别率,在德国柏林情感数据库识别率达到了84.29%。3.情感计算的最终目的是实现人与计算机之间的情感互动,所以我们提出了基于手机安卓系统的语音情感交互框架,设计并实现了基于安卓的语音情感识别系统,该系统可以使得安卓手机实现语音情感的计算与识别。
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.34
【图文】:

情感模型,效价,情感


图 1-1 激活度-效价情感模型有不同的特点:从模型的复杂角度,离散情感模型利用简合人们日常对于情感的定义方式。但是维度情感模型的分需要考虑不同的维度属性,还需要考虑到不同维度下的强都代表了一种独特的情感;从而维度情感模型由于其每个情感难以判别且更加抽象。根据两种情感模型的优劣,本据库音情感识别技术是基于语音情感数据库进行的,所以数据。但是,由于语音情感的模糊性,语音情感数据库的建立分类分为两类:离散情感和维度情感。其次,根据情绪激引导型和自然型。目前,国内外的大部分研究都是基于离流语音情感数据库。

原理图,情感识别,语音,原理图


活度与控制)。共 947 句,16kHz 采样,16bit 量化。.5 语音情感识别的一般过程语音情感识别是语音识别领域的一个分支。它主要涉及声学、信息科学、人工科,其一般过程类似于模式识别过程:训练阶段和识别阶段。第一个阶段是情感理和语音特征提取的训练,也可以对特征进行降维处理[29],然后利用这些特征建型,然后识别阶段,我们提取待测语音相应的语音情感特征的进行识别。以下为:1,预处理主要包括语音的预加重、分帧与加窗、区分噪声段的端点检测等。2,使用多种特征组合的方法,提取多种特征参数。一些研究者对语音情感的组行降维处理,然后利用处理后的特征向量进行识别。3,我们将特征分为训练集与测试集,其中测试集输入分类器模型进行分类器训试集则用于测试分类器的效果。

频谱,预加重,频谱,分帧


图2 -1预加重频谱效果对比2 预处理加窗与分帧于语音信号具有短时平稳性,即在短时段上语音相对平稳,各种性质不变,信号的处理,容易丢失了时域信息。而短时的分析,能在一定程度上保留时们对语音信号进行分帧操作,为了让语言信号在短时保持相对平稳更便于以一般帧长在 10~30ms,通常为了弥补窗函数造成的两端信号衰减,对信号部分重叠,该重叠部分为帧移,帧移一般为帧长的 0 至 50%。式 w( n )为分帧时所用窗函数, s ( n )为语音信号, ( )ws n 为加窗分帧后的信号( ) ( ) ( )ws n s n w n了提高频谱分辨率并且减少频谱泄露,需要对信号进行加窗处理。而加窗步比较常用的有矩形窗、汉明窗两种,它们的函数表达形式如下(帧长用 N 表形窗:

【参考文献】

相关期刊论文 前9条

1 韩文静;李海峰;阮华斌;马琳;;语音情感识别研究进展综述[J];软件学报;2014年01期

2 黄程韦;赵艳;金峗;于寅骅;赵力;;实用语音情感的特征分析与识别的研究[J];电子与信息学报;2011年01期

3 余华;黄程韦;金峗;赵力;;基于粒子群优化神经网络的语音情感识别[J];数据采集与处理;2011年01期

4 张石清;赵知劲;雷必成;杨广映;;结合音质特征和韵律特征的语音情感识别[J];电路与系统学报;2009年04期

5 乔冠楠;胡剑凌;刘鹏;;声学参数和听觉参数结合的语音情感交叉识别[J];电声技术;2009年06期

6 赵腊生;张强;魏小鹏;;语音情感识别研究进展[J];计算机应用研究;2009年02期

7 高慧;苏广川;陈善广;;基于Teager能量算子(TEO)非线性特征的语音情绪识别[J];航天医学与医学工程;2005年06期

8 赵力,钱向民,邹采荣,吴镇扬;语音信号中的情感识别研究[J];软件学报;2001年07期

9 陈亮,张雄伟;语音信号非线性特征的研究[J];解放军理工大学学报(自然科学版);2000年02期

相关博士学位论文 前4条

1 张昕然;跨库语音情感识别若干关键技术研究[D];东南大学;2016年

2 王坤侠;语音情感识别方法研究[D];合肥工业大学;2015年

3 孙亚新;语音情感识别中的特征提取与识别算法研究[D];华南理工大学;2015年

4 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年

相关硕士学位论文 前2条

1 谢玲;语音情感识别的研究[D];广西师范大学;2016年

2 安秀红;基于特征参数的语音情感识别[D];太原理工大学;2011年



本文编号:2807153

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2807153.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3c6ce***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com