当前位置:主页 > 教育论文 > 教育技术论文 >

基于主动学习的藏语语音识别在在线教育中的应用

发布时间:2020-03-23 03:14
【摘要】:随着科学信息技术以及互联网技术的不断发展,在线教育凭借其跨越时空限制,优质教育资源共享的特点,在我国的国民教育中发挥着重要的作用。而我国藏族地区因地域、历史等因素影响,教育资源与中东部沿海地区优秀教育资源存在一定的差异。在线教育所特有的优质教育资源共享、跨越时间和空间的特色可以在一定程度上解决藏族地区在教育资源上的不足,缩小与中东部沿海发达地区在教育上的差距,实现教育公平,加速藏族地区教育现代化进程。在线教育平台中教学视频的语音识别是网络中视频结构化处理必不可少的模块。但是在我国以学堂在线、网易公开课、中国MOOC网、可汗学院等为代表的在线教育平台语音识别以普通话和英语为主,以藏语为主的语音识别相对匮乏。由于藏语属于小语种语言,现有藏语语音识别建模大部分采用有监督学习的方法建立语音识别模型,为了建立高准确率的语音识别模型,这种学习方式需要大量带标注的语音语料,而语音语料的标注是一件极其费时费力的工作,并且由于地域历史等原因,藏语语音信息资源较少,语音学标注专家也比较缺乏,在现有语音语料资源缺乏的情况下,我们将在本文采用主动学习的方式从大量未标注的语音数据中挑选一部分具有价值的样本交给用户进行标注,以利用少量高质量的训练样本构建与大数据量样本训练方式一样精准的识别模型,来减少人工标注的数据量,解决标注工作繁琐冗长的问题,提高工作效率,加速在线教育在藏族地区推广的进程。本文将阐述主动学习和藏语语音识别的基本原理,以及将它们应用在藏族地区在线教育视频当中的必要性及可行性。根据藏语语音学的基本知识,开展基于临近最优主动学习的藏语语音识别研究,然后利用QT Creator搭建基于主动学习的藏语语音识别系统及在线教育视频语音内容识别系统,实现藏语语音实时采音和识别,最终把识别结果通过藏文文字形式显示在视频下方,形成带有字幕的教学视频,以达到提高学习者对教学视频内容的直观理解,提高学习者的学习效率,促进优质教育教学资源在藏族地区的传播,推动教育信息化进程的目的。
【图文】:

语音识别,成人教育,视频,代表人物


[9],之后,国外语音识别研宄开始步入迅速发展时期。通过查阅相关文献将国外各个时逡逑期的语音识别领域代表人物的相关研究进行总结|1(M41,将分析结果通过下图1-3进行展逡逑示:逡逑5逡逑

结构图,语音识别系统,结构图,声学模型


但是语音识别系统的组成结构基本相同,主要由语音信号前端处理、声学模型、逡逑语言模型、发音字典解码器等部分构成。藏语语音识别系统也由上述几部分构成,系统逡逑构成如图2-1所示:逡逑发音逡逑字典邋逦邋逦邋^逡逑逦f邋>文本数据库逡逑—卿口邋_信号幽_/识型训练逡逑 巧i邋&特征提取K别声学y声学模u语音信逡逑模型^型训练号处理逡逑^逦Z3LT逡逑fZ逡逑语音数据库逡逑逦^逡逑图2-1语音识别系统结构图逡逑2.3声学模型逡逑声学模型训练是自动语音识别(ASR)系统的重要组成部分,常见的声学建模方法逡逑有HMM邋(隐马尔可夫模型)、DP邋(动态规划)、DTW邋(动态时间规划)等。目前,声学逡逑建模的主流方法仍是HMM邋(隐马尔可夫模型)。逡逑2.3.1隐马尔科夫模型(HMM)逡逑HMM模型因其具有顺序排列的马尔科夫状态,能够描述语音信号中的空间向量的逡逑特性,分段处理短时平稳的语音特征,逼近全局非平稳的语音特征序列的特性,从而成逡逑为最主要的语音识别声学模型。逡逑HMM模型用来描述语音信号时,有两个过程,一个是具有特定状态数的隐马尔科逡逑夫链,,另外一个是显示随机函数集[27]。能够用以下五个元素进行描述L逦F,逡逑y和&表示集合
【学位授予单位】:中央民族大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:H214;G434

【参考文献】

相关期刊论文 前10条

1 王辉;赵悦;刘晓凤;徐晓娜;周楠;许彦敏;;基于深度特征学习的藏语语音识别[J];东北师大学报(自然科学版);2015年04期

2 袁胜龙;郭武;戴礼荣;;基于深层神经网络的藏语识别[J];模式识别与人工智能;2015年03期

3 陈琪琳;鲍浩波;;中国在线教育发展的历程与现状[J];学园;2014年26期

4 李士艳;;国内外MOOC的发展及其特点[J];中小学电教;2014年09期

5 陈小莹;;藏语拉萨话语音合成语料库的研究与建立[J];科技信息;2013年09期

6 胡政权;曾毓敏;宗原;李梦超;;说话人识别中MFCC参数提取的改进[J];计算机工程与应用;2014年07期

7 张飞宇;;在线教学平台中视频语音识别系统设计[J];电子科技;2012年10期

8 李冠宇;孟猛;;藏语拉萨话大词表连续语音识别声学模型研究[J];计算机工程;2012年05期

9 刘文香;;藏文音节校对模型建设研究[J];西北民族大学学报(自然科学版);2009年02期

10 姚徐;李永宏;单广荣;于洪志;;藏语孤立词语音识别系统研究[J];西北民族大学学报(自然科学版);2009年01期

相关硕士学位论文 前5条

1 张宇聪;基于深度学习的藏语拉萨方言语音识别的研究[D];西北师范大学;2016年

2 曾婷;在线教育市场细分及其商业模式研究[D];东南大学;2015年

3 拉龙东智;藏语语音识别技术研究[D];西藏大学;2015年

4 张飞宇;在线协同学习平台中教学视频语音识别系统设计与实现[D];西安电子科技大学;2012年

5 陈邦泽;甘南藏族自治州中小学现代远程教育现状及对策研究[D];西北师范大学;2005年



本文编号:2596086

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/jykj/2596086.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2e62a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com