当前位置:主页 > 科技论文 > 网络通信论文 >

语音情感识别中语谱图纹理特征提取算法研究

发布时间:2024-03-02 05:27
  目前,传统的语音情感特征主要有音质特征、韵律学特征和频谱特征等,都单一地集中于语音的时域或者频域,而很少考虑语音的时频相关特性,使得提取的特征不充分。语谱图能够很好地联通语音的时频两域,使得研究语音的时频相关性变成可能。基于此,本文从以下两个方面开展语谱图的纹理特征提取研究:1)针对完全局部二值模式(Complete Local Binary Pattern,CLBP)特征维度高,且在缺失中心像素点的情况下又过分依赖中心像素点的不足,构建了均匀完全局部二值符号模式(UniformCLBPSign,UCLBPS)和改进幅度模式(Improved CLBP_Magnitude,ICLBPM)。同时,针对经典决策级加权投票融合方法在分类器识别性能大体相同时无法发挥作用的缺点,提出幂指数加权融合方法。首先,将原始语音样本转化为语谱图,再使用多尺度、多方向的Log-Gabor滤波器对语谱图做处理,放大语谱图的细节信息;然后提取语谱图的UCLBPS和ICLBP_M的分...

【文章页数】:66 页

【学位级别】:硕士

【部分图文】:

图2.1语音情感识别流程图??

图2.1语音情感识别流程图??

并进行预加重,提升语音样本的质量。??作为人工智能与模式识别的一个分支,语音情感识别技术与人脸表情识别技??术相类似,大体分为语音预处理、语音情感特征提取和分类识别三部分,如图2.1??所示:??————?'?—?N??I?1???I??*?■■■■■■?1?I'"???1?\?....


图2.2分帧加窗??

图2.2分帧加窗??

2.2.1梅尔倒谱系数??MFCC是语音分析中应用最广泛的特征之一。它是基于人类听觉系统提取的,??为语音情感识别提供了一种自然、真实的参考。MFCC的计算过程如图2.3所示。??10??


图2.3?MFCC特征提取流程图??.

图2.3?MFCC特征提取流程图??.

这一声道特征将会改变,因此,语音中的情感信息可以利用这些特征提??取出来。使用LPCC的优点是它的算法效率更高,计算量较少,可以有效地描述元??音[42],其具体计算方式如图2.4所示:??语音样本一"?预处理??计算LPC?¥计算LPCC??图2.4?LPCC特征提取流程图??....


图2.5?PLP特征提取流程图??

图2.5?PLP特征提取流程图??

语音样本一?预加重?一?分帧一?]加窗—????FFT?一??MEL滤波器组-?对数运算一??DCT??图2.3?MFCC特征提取流程图??Fig?2.3?Flow?chart?of?MFCC?feature?extraction??在预处理后,使语音帧通过汉明窗,然后采用快速傅....



本文编号:3916401

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/3916401.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d5c49***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com