当前位置:主页 > 文艺论文 > 语言学论文 >

基于GRU-HMM声学模型的湖南方言辨识

发布时间:2023-06-19 19:46
  20世纪90年代,方言辨识开始逐渐被越来越多的人们重视,各国的研究人员对不同种类方言的特征和分类模型进行了大量研究,同时方言辨识在刑事案件中犯罪嫌疑人的归属地判定方面有重大贡献。中国是一个多民族的人口大国,各民族各地区的语言都有些许不同,因此,为了能够更好的推广语音识别技术的应用,着眼于方言辨识的研究是非常有意义的。早年较为常用的声学模型主要有隐马尔科夫模型(HMM)和人工神经网络(ANN),像BP神经网络和RBF神经网络等,并且至今都在沿用以及不断优化中。而近年来,随着深度学习在语音识别领域中大量成功实践,对多层神经网络采用深度学习算法,可以得到更好的初始化权值,使得网络在最佳的极值点处能够更快完成收敛,从而改善了传统神经网络的不足。本文通过对湖南长沙、株洲、衡阳、湘潭四地方言进行研究,以MATLAB为实验平台,提出了一种基于门控循环单元(GRU)神经网络和HMM结合的声学模型,取得了较好的识别效果,主要研究内容包括:本文对语音特征参数提取进行了研究,针对传统的MFCC特征参数的不足,研究了基于人耳听觉模型的特征参数CFCC的提取。详细介绍了CFCC特征参数的原理和提取方法,分析了耳...

【文章页数】:66 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 引言
    1.2 相关领域的发展与现状
        1.2.1 方言辨识的发展与现状
        1.2.2 神经网络技术的发展与现状
    1.3 方言辨识的主要方法
    1.4 神经网络对方言辨识的意义
    1.5 论文结构安排
第二章 语音识别基础理论
    2.1 方言辨识系统结构
    2.2 语音信号的预处理
    2.3 语音信号的特征提取
    2.4 声学模型
        2.4.1 隐马尔科夫(HMM)模型
        2.4.2 基于GMM-HMM声学模型
        2.4.3 基于神经网络的声学模型
    2.5 本章小结
第三章 基于听觉变换的耳蜗倒谱系数(CFCC)的提取
    3.1 听觉变换的原理
    3.2 耳蜗倒谱系数(CFCC)的提取过程
    3.3 耳蜗滤波器
    3.4 毛细胞窗口
    3.5 非线性响度变换和离散余弦变换
    3.6 不同特征参数对识别率的影响实验
    3.7 本章小结
第四章 基于GRU-HMM声学模型的方言辨识
    4.1 门控循环单元GRU的基本理论
    4.2 GRU模型的训练
    4.3 GRU-HMM模型
    4.4 实验结果与分析
    4.5 本章小结
第五章 总结与展望
参考文献
附录 中英文缩写名词对照表
发表论文和科研情况说明
致谢



本文编号:3835011

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/3835011.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户de1a1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com