当前位置:主页 > 科技论文 > 网络通信论文 >

基于Kaldi的罗平方言语音识别研究

发布时间:2020-10-27 17:50
【摘要】:语音是人类信息交互的主要手段,近年来,随着科学技术的不断发展,语音识别开始应用于生活的方方面面,不过当前中文语音识别系统均是基于普通话,对于中国这样一个地域广大、民族众多的国家来说,存在着众多方言,基于普通话的语音识别系统是远远不能满足大众需求的,所以针对各地区方言的研究与应用显得尤为必要。本文简要介绍了语音识别的发展历史,阐述了语音识别技术的基本原理,认真分析了语音识别的每一项技术的诞生对语音识别发展的重要意义。.并研究了从原始的模拟语音信号采集处理到构建语言模型和声学模型的全过程中所涉及的相关技术。接下来的论述中,着重研究了语音识别的声学模型。本文所研究的声学模型包括:单音素模型、三音素模型、优化后的三音素模型、隐马尔科夫模型(HMM)、以及深度神经网络模型(DNN)。本文还对语音识别的语言模型进行了研究,在本课题中,主要研究了基于统计的N-gram模型。最后本文对罗平方言的特征进行了分析,搭建了基于Kaldi的罗平方言语音识别系统。在文中,搭建了五组对比实验,比较了在不同的声学模型、不同的语言模型及不同的训练样本数量下系统的识别准确性能。实验表明,在六种不同的声学模型中,基于DNN的声学模型识别准确率最高,高达96.82%,且基于二元文法模型的实验结果优于一元文法模型。在二元文法模型实验中,随着训练数据样本从1980条增加到2420条,系统识别正确率不断提高,这表明训练样本数据量越大,系统识别正确率越高。在此基础上,对训练样本和测试样本进行调整,测试结果表明,系统具有良好的自适应性。
【学位授予单位】:云南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.34
【图文】:

基于Kaldi的罗平方言语音识别研究


图2-2分帧图??

基于Kaldi的罗平方言语音识别研究


图2-3窗函数幅频特性曲线??2-3,,一■

基于Kaldi的罗平方言语音识别研究


图3-6?—层RBM原理图??
【参考文献】

中国期刊全文数据库 前10条

1 罗宪华;徐海明;;基于特定人的语音情感识别系统构建[J];中国人民公安大学学报(自然科学版);2015年04期

2 屈丹;张文林;;基于稀疏组LASSO约束的本征音子说话人自适应[J];通信学报;2015年09期

3 张思远;蒋朝惠;;基于音频的数字视频内容安全检测模型研究[J];计算机应用与软件;2013年06期

4 梁浩;杨光宇;;基于连续隐马尔科夫的语音识别模型[J];无线互联科技;2013年06期

5 田莎莎;唐菀;佘纬;;改进MFCC参数在非特定人语音识别中的研究[J];科技通报;2013年03期

6 艾散·帕合提;买尔丹·祖农;蔡亚永;;计算机语音识别与合成技术[J];中国新通信;2012年21期

7 熊华乔;郑建彬;詹恩奇;汪阳;华剑;;基于说话人模型聚类的说话人识别[J];计算机工程与应用;2014年02期

8 柳玲玲;赵晖;;联机手写维吾尔文单词识别中两种语言模型的比较研究[J];计算机应用与软件;2012年09期

9 史明泉;;基于DSP的语音录放系统的设计[J];无线电工程;2011年12期

10 张海燕;唐建芳;;基于RBF神经网络的语音情感识别[J];四川理工学院学报(自然科学版);2011年05期


中国硕士学位论文全文数据库 前6条

1 刘胜江;连续数字语音识别系统的研究及应用[D];浙江工业大学;2016年

2 李思舒;一种多语言、多编码的识别方法[D];南京大学;2012年

3 周芬;基于电话信道的声纹识别算法研究[D];南京理工大学;2012年

4 何金瑞;说话人识别中的模式匹配方法研究[D];西华大学;2009年

5 陈金明;人工神经网络在电子设备自动控制方面的研究与应用[D];电子科技大学;2008年

6 胡磊;基于隐马尔科夫模型的语音识别技术研究[D];武汉理工大学;2007年



本文编号:2858847

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2858847.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户12354***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com