当前位置:主页 > 科技论文 > 自动化论文 >

深度学习在四川方言语音识别中的应用研究

发布时间:2023-05-21 22:35
  近年来,随着深度学习的快速发展,语音识别技术也有了长足的进步。语音识别技术的愈渐成熟,加之各地文化的互相影响,使用方言进行人机语音交互已经成为了研究的新方向。四川方言以其独特的魅力活跃在各社交媒体和网络平台,并且四川方言的使用人数已达数亿人,研究四川方言语音识别对于了解巴蜀文化和变迁有着一定的积极作用。语音识别不仅是大热的研究方向,也是科研的研究重点,研究人员对语音的识别和辨识做出了大量研究。尽管已有关于方言语音识别的研究,但是研究四川方言语音识别的屈指可数。本文主要使用卷积神经网络、门控循环网络和隐马尔科夫模型、Transformer模型进行四川方言语音识别研究,构建四川方言语料库,提出基于改进的卷积神经网络和门控循环网络的语音识别方法,具体的研究内容如下:针对四川方言没有公开的标准语料库的问题,设计了四川方言语料库,语料库数据提取自四川本土方言影视剧,分别对其进行格式转换、切割、标注、核对后,将所有数据划分为3个数据集,包括2个训练集和1个测试集,训练集分别包含约201分钟、30分钟的语音数据,测试集的语音数据时长为20分钟。通过该语料库实现了从语音音频到普通话文字标注的对应。针对...

【文章页数】:60 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 前言
    1.1 课题研究背景及意义
    1.2 语音识别
        1.2.1 语音识别的发展历史
        1.2.2 语音识别系统框架
    1.3 四川方言语音识别的研究现状
    1.4 本文的主要内容以及组织结构
        1.4.1 本文主要内容
        1.4.2 论文结构安排
第2章 相关理论知识
    2.1 卷积神经网络
        2.1.1 卷积神经网络概述
        2.1.2 激活函数
        2.1.3 过拟合抑制
    2.2 门控循环网络
        2.2.1 深度学习序列模型
        2.2.2 通过时间的反向传播
        2.2.3 门控循环单元
    2.3 Transformer模型
    2.4 评价指标
    2.5 本章小结
第3章 四川方言语料库的建立
    3.1 四川方言发音
        3.1.1 成都话声母、韵母特点
        3.1.2 成都话的声调特性
        3.1.3 成都话的变调特性
    3.2 四川方言语料库的建立
        3.2.1 语料库的设计原则
        3.2.2 语料库建立流程
        3.2.3 语料的选取
        3.2.4 语料的切分和标注
        3.2.5 拼音及音调的标注
    3.3 本章小结
第4章 基于改进的CNN的语音识别研究
    4.1 模型框架
        4.1.1 语音预处理
        4.1.2 基于全卷积神经网络的语音特征提取
        4.1.3 CTC解码
        4.1.4 基于隐马尔可夫链的语言模型
    4.2 实验设置与结果分析
    4.3 本章小结
第5章 基于改进的GRU的语音识别研究
    5.1 基于双向GRU的声学模型
    5.2 网络框架及参数调节
    5.3 实验结果分析
    5.4 本章小结
第6章 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢
在学期间的科研情况



本文编号:3821552

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3821552.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户37b29***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com