当前位置:主页 > 科技论文 > 自动化论文 >

基于卷积神经网络语音情感识别的研究与实现

发布时间:2021-04-14 16:58
  近年来,随着人工智能技术迅速的发展,人与机器的语音交互越来越智能化。人机交互中的语音情感识别已是目前人工智能领域研究热点,使机器人拥有人一样的情感状态,这也是未来发展的一个必然趋势。本文主要研究基于卷积神经网络的语音情感识别算法。在卷积神经网络算法方面,本文先介绍了卷积神经网络的基本理论,随后针对卷积神经网络训练过程中的卷积核权值的更新算法进行改进,使卷积核权值的更新算法与迭代次数有关联,提高卷积神经网络的表达能力。在语音情感特征提取方面,本文介绍了常用的语音特征提取方法,选择提取语音特征应用最广泛的梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)方法进行实验,同时为了增加情感语音之间的特征差异性,将语音信号经过预处理后得到的梅尔频率倒谱系数特征数据矩阵做变换,提高语音情感识别率。对上述改进卷积神经网络的语音情感识别模型进行实验分析,实验表明,改进后的语音情感识别算法的错误识别率比传统算法减少约7%。除此之外,本文还在基于ARM(Advanced RISC Machines)的服务型机器人实现语音情感识别,设计了语音情感识别系统。根据... 

【文章来源】:暨南大学广东省 211工程院校

【文章页数】:70 页

【学位级别】:硕士

【部分图文】:

基于卷积神经网络语音情感识别的研究与实现


卷积神经网络结构图

输出向量,情感,情感识别,整数


暨南大学硕士学位论文结构模型进行语音情感识别时,结果输出的向量一般不为二进制整数,其取值都在 0-1间的小数。这时将输出向量的数据进行对比,最接近整数 1 的分量则是对应情感类别。如图 4-3 所示列出在 Matlab 下仿真得到的实验数据,其为 240 句测试集中 10 句的情感别数据,其中在输出向量的 6 个分量中最接近 1 的则为对应情感类别。由于数据量巨大, Matlab 下仿真直接计算出每一次测试的错误识别率,所以在后序实验数据分析中,本文接列出每一次测试的错误识别率。

对比曲线,线性,卷积核,特征数据


图 4-4 错误识别率对比曲线图 4-4 的错误识别率对比曲线可以看到:1)传统 CNN (A1)模型虽然在第 21 次迭近收敛,但收敛不稳定;线性改进 CNN (A1)模型在第 24 次迭代收敛并相对稳定为卷积核权值每次更新的改变量都是随着迭代次数的增加而逐渐递减,因此随着的增加而卷积核权值逐渐的变得稳定,模型的识别率收敛稳定,而且错误识别率的减少;2)同等训练条件下,增大输入特征数据的线性改进 CNN (A2)模型在第开始收敛且稳定,模型收敛速度更快,由于将输入的特征数据增加一倍可以更好语音情感之间特征差异性,且错误识别率更低,因此收敛的更快。从图 4-4 明显提出的改进语音情感识别方法的优势。其中线性改进卷积神经网络 CNN(A2)模型感识别详细结果如表 4-21 所示。表 4-21 线性改进卷积神经网络 CNN(A2)模型测试数据情感类别 样本总数 训练数目 测试数目 错误识别数目 错误识别率生气 200 160 40 9 22.50%害怕 200 160 40 25 62.50%

【参考文献】:
期刊论文
[1]嵌入式系统发展概述[J]. 韦照川,李德明.  科技信息. 2010(01)
[2]嵌入式软件发展趋势[J]. 吴朝晖.  电子产品世界. 2005(03)
[3]语音情感特征提取和识别的研究与实现[J]. 詹永照,曹鹏.  江苏大学学报(自然科学版). 2005(01)
[4]基于HMM的关键词识别系统[J]. 李云霞,李治柱,吴亚栋.  计算机工程. 2004(07)
[5]语音信号中情感特征的分析和识别[J]. 余华,王治平,赵力.  电声技术. 2004(03)
[6]利用模糊熵进行参数有效性分析的语音情感识别[J]. 王治平,赵力,邹采荣.  电路与系统学报. 2003(03)
[7]语音信号中的情感识别研究[J]. 赵力,钱向民,邹采荣,吴镇扬.  软件学报. 2001(07)
[8]语音信号中的情感特征分析和识别的研究[J]. 赵力,钱向民,邹采荣,吴镇扬.  通信学报. 2000(10)
[9]包含在语音信号中情感特征的分析[J]. 钱向民.  电子技术应用. 2000(05)
[10]人机交互技术研究新进展[J]. 方志刚,吴晓波,马卫娟.  计算机工程与设计. 1998(01)

硕士论文
[1]改进的GRBM在语音识别中的应用研究[D]. 赵彩光.暨南大学 2015
[2]基于卷积神经网络的语音情感识别[D]. 陈晓东.华南理工大学 2015
[3]基于HTK的嵌入式语音识别系统设计与优化[D]. 夏拓.华南理工大学 2012
[4]语音情感特征提取方法和情感识别研究[D]. 郭鹏娟.西北工业大学 2007



本文编号:3137680

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3137680.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户328f0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com