当前位置:主页 > 科技论文 > 网络通信论文 >

结合语谱图和神经网络的语音情感识别

发布时间:2023-10-02 03:37
  语音作为人们日常交流最重要的方式之一,其中蕴含了大量的跟情感相关的信息。随着近年来人工智能的发展以及技术研究的深入,使得人机交互成为了当今的研究热点,让机器具备跟人一样能识别和表达情感的能力成为研究者们的目标,语音情感识别的重要性也日益凸显出来。语音情感识别是语音处理领域富有挑战性的课题之一,它的应用非常广泛,因此,这项研究具有重要的理论意义和应用前景。目前,在语音特征提取方面,大多数研究者选择的是韵律特征、音质特征或者是基于谱的特征,而把时域和频域结合在一起的研究则相对较少。而语谱图具有把时域信息和频域信息结合在一起的特点,它本身就包含了大量跟语音相关的信息,因此本文选用语谱图来提取语音情感特征。本文的主要研究工作如下:1)阐述了语音情感识别的研究背景和意义,对语音情感识别的研究历史和现状做了简单的归纳总结,研究情感分类的模型、常用的语音情感数据库。2)对语音情感数据的预处理能够提高分析精确度,本文对语音的预处理包括预加重、分帧加窗和端点检测,经过预处理之后,提取出语音信号的基音频率、短时能量、短时过零率、共振峰和梅尔倒谱系数等参数组成情感特征矢量。3)在简单研究人工神经网络的发展、...

【文章页数】:69 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 语音情感识别的研究背景和意义
    1.2 研究历史与现状
    1.3 本文的研究内容与结构安排
第2章 语音情感识别的基础
    2.1 情感分类的描述模型
        2.1.1 离散情感论
        2.1.2 维度情感论
    2.2 语音情感数据库
        2.2.1 离散情感数据库
        2.2.2 维度情感数据库
    2.3 语音情感信号预处理
        2.3.1 预加重
        2.3.2 分帧加窗
        2.3.3 端点检测
    2.4 声学特征提取
        2.4.1 语速
        2.4.2 基频
        2.4.3 短时能量和短时平均幅值
        2.4.4 短时平均过零率
        2.4.5 共振峰
        2.4.6 梅尔倒谱系数
    2.5 本章小结
第3章 人工神经网络
    3.1 概述及发展
    3.2 神经网络模型
    3.3 BP神经网络
        3.3.1 BP网络模型
        3.3.2 BP学习算法
        3.3.3 改进的BP算法
        3.3.4 实验
    3.4 本章小结
第4章 卷积神经网络
    4.1 基本概念
    4.2 卷积神经网络原理
        4.2.1 局部连接
        4.2.2 权值共享
        4.2.3 卷积层和池化层
    4.3 基于卷积神经网络的语音情感识别
        4.3.1 语谱图的处理
        4.3.2 CNN网络基本结构
        4.3.3 分类器的选择
    4.4 实验及结果分析
        4.4.1 网络训练次数对实验结果的影响
        4.4.2 选择不同分类器的对比实验
        4.4.3 在不同环境下的对比实验
        4.4.4 在不同的信噪比下的对比实验
    4.5 本章小结
第5章 总结与展望
    5.1 总结
    5.2 展望
参考文献
致谢
附录A 个人简历
附录B 攻读硕士学位期间完成的主要工作



本文编号:3850020

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/3850020.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户564e2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com