当前位置:主页 > 科技论文 > 自动化论文 >

基于双向循环神经网络的藏语语音识别研究

发布时间:2022-02-21 20:57
  随着智能手机的出现,终端的应用便成为了当今技术的发展潮流。苹果公司在智能手机里引入了语音识别的技术,掀起了人机交互的热潮。在人们的互相沟通中语音是最直接最方便的交流方式,比起鼠标,键盘这些设备,语音是最快捷也是最受欢迎的输入方法。由于传统的语音识别模型对非特定人和复杂多变的语音不能够很好识别和目前语音识别方面对藏语的研究较少,所以本文的研究是基于双向循环神经网络的藏语语音识别研究,双向循环神经网络倾向处理序列性数据,利用双向循环神经网络进行藏语语音识别,可以提高语音的稳定性和准确率。本文的研究内容如下:1)语音获取。从语料库中截取一段音频作为输入,输入到语音系统中。2)预处理。语音信号的预处理操作分别是预加重,分帧,加窗,预处理首先要对语音进行抗混叠滤波的处理,这是因为人们本身也会对语音造成影响,这个操作是尽可能的降低频率折叠导致虚假频率的成分;其次,人们说话时会产生口唇辐射,通过进行预加重,提高高频分辨率;语音信号的特点是短时平稳,所以预加重后面要进行分帧加窗。预处理操作能够进一步提高语音识别的识别率。3)特征提取。现在能够选用的提取方式可选范围较大,此次研究围绕的提取方式是基于快速... 

【文章来源】:青海师范大学青海省

【文章页数】:50 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状与发展前景
    1.3 主要内容
    1.4 论文结构
第二章 语音识别的预处理
    2.1 语音识别系统
    2.2 语音的预处理
        2.2.1 预加重
        2.2.2 分帧加窗
        2.2.3 短时时域分析
        2.2.4 短时频域分析
        2.2.5 端点检测
    2.3 本章小结
第三章 语音识别的特征提取
    3.1 引言
    3.2 快速傅立叶变换定义
        3.2.1 傅立叶变换
        3.2.2 快速傅立叶变换
        3.2.3 Mel频率倒谱系数
    3.3 MFCC特征提取
    3.4 本章小结
第四章 基于双向循环神经网络的声学建模
    4.1 引言
    4.2 循环神经网络
        4.2.1 循环神经网络的模型结构
        4.2.2 循环神经网络的训练方法
        4.2.3 长短时神经网络
    4.3 双向循环神经网络
        4.3.1 双向循环网络的模型结构
        4.3.2 双向循环神经网络的训练方法
    4.4 本章小节
第五章 基于双向循环神经网络的藏语语音识别
    5.1 TensorFlow简介
    5.2 基于双向循环神经网络的藏语语音识别系统
        5.2.1 语料库的介绍
        5.2.2 藏语语音预处理
        5.2.3 藏语语音特征提取
        5.2.4 CTC算法
    5.3 实验结果
        5.3.1 系统性能受到不同参数的影响
        5.3.2 基于双向循环神经网络藏语语音识别系统性能
    5.4 本章小结
第六章 总结与展望
    6.1 本文工作总结
    6.2 本文工作展望
参考文献
致谢
个人简历
在校期间的研究成果


【参考文献】:
期刊论文
[1]基于循环神经网络的语音识别研究[J]. 唐美丽,胡琼,马廷淮.  现代电子技术. 2019(14)
[2]基于DNN的低资源语音识别特征提取技术[J]. 秦楚雄,张连海.  自动化学报. 2017(07)
[3]基于深度学习神经网络的孤立词语音识别的研究[J]. 王山海,景新幸,杨海燕.  计算机应用研究. 2015(08)
[4]基于层次稀疏DBN的瓶颈特征提取方法[J]. 王一,杨俊安,刘辉,柳林.  模式识别与人工智能. 2015(02)
[5]深度学习神经网络在语音识别中的应用[J]. 刘豫军,夏聪.  网络安全技术与应用. 2014(12)
[6]卷积神经网络在语音识别中的应用[J]. 张晴晴,刘勇,王智超,潘接林,颜永红.  网络新媒体技术. 2014(06)
[7]基于LDA-MFCC的藏语语音特征提取技术研究[J]. 普次仁,顿珠次仁.  西藏大学学报(自然科学版). 2014(01)
[8]说话人识别中MFCC参数提取的改进[J]. 胡政权,曾毓敏,宗原,李梦超.  计算机工程与应用. 2014(07)
[9]用于噪声鲁棒性语音识别的子带能量规整感知线性预测系数[J]. 蔡尚,金鑫,高圣翔,潘接林,颜永红.  声学学报. 2012(06)
[10]基于HMM和新型前馈型神经网络的语音识别研究[J]. 冯宏伟,薛蕾.  计算机工程与设计. 2010(24)

硕士论文
[1]基于深度学习的藏语非特定人连续语音识别研究[D]. 周楠.中央民族大学 2017
[2]藏语语音深度特征提取及语音识别研究[D]. 刘晓凤.中央民族大学 2016
[3]基于嵌入式语音识别系统的研究[D]. 宋艳.西安科技大学 2011
[4]量子智能算法及其在语音识别中的应用[D]. 陈兰.南京邮电大学 2011
[5]基于特定人小词汇量藏语语音特征值提取的研究[D]. 德庆卓玛.西藏大学 2010
[6]基于神经网络的语音识别研究[D]. 王伟臻.浙江大学 2008
[7]一种基于RBF神经网络的命令集语音识别系统研究[D]. 曾敏.广西大学 2007
[8]噪声环境下语音特征提取前端处理及优化帧算法研究[D]. 孙颖.太原理工大学 2007
[9]基于HMM噪声背景下的语音识别方法的研究[D]. 黄湘松.哈尔滨工程大学 2005



本文编号:3638026

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3638026.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c546f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com