当前位置:主页 > 教育论文 > 课堂教学论文 >

互联网教育的视频云笔记及其内容分析研究

发布时间:2020-09-08 21:46
   当今社会,互联网在线教学和课堂面对面教学是教育行业两种主要的教学方式,互联网在线教学打破课堂面对面教学在时间、空间的限制,为学习者提供丰富的教学资源和多样的学习平台。然而,学习多样化改变的同时,学习辅助工具并没有突破性的进展,尤其是视频云笔记。视频云笔记作为学习者和视频资源交互的工具,可以提供便捷的笔记记录方式、完善的笔记分享机制及个性化的笔记服务。一个完善的视频云笔记可以发挥笔记内容的潜能,挖掘教学视频的重点和难点,也有利于帮助学习者构建完善的知识体系。现有的视频云笔记中,学习者采用传统键盘输入方式记录笔记,同时观看视频和操作键盘会降低学习者学习效率,如果能将便捷且人机交互性好的语音识别技术融入其中,则会很大程度改善这一现象。而且在视频学习过程中,学习者只重视笔记内容的回忆巩固,研究人员也对学习者笔记内容的分析研究知之甚微,这样不利于发挥笔记内容的潜在作用。基于以上问题,本文的主要贡献如下:1、对语音识别技术中的DNN-HMM声学模型进行研究。分析深度神经网络模型的组成和训练,结合隐马尔科夫模型建立基于视频云笔记的DNN-HMM声学模型,将它们进行解析、设计和训练,采用THCHS30中文语料库和人工录制的实验数据测试DNN-HMM声学模型在视频云笔记语音识别中的准确率。实验结果表明,该模型的词错误率和句错误率都低于传统的GMM-HMM模型,能够有效提高视频云笔记的学习质量。2、深入分析学习者笔记内容,利用TF-IDF算法提取笔记内容热点。首先针对传统TF-IDF算法对笔记内容热点提取中的不足,并结合笔记篇幅简短、言简意赅、标题正文分开的特点,提出一种基于笔记内容热点分析的改进算法TF-IDF-G,在算法中引入笔记词性和位置权重因子。然后对笔记内容进行中文分词、词性标记和位置获取处理。最后采用学习平台笔记数据集验证TF-IDF-G算法在笔记内容热点提取的正确性。最后,以西安电子科技大学网络与继续教育学院学习平台为对象,实现一款面向在线学习的视频云笔记。把训练好的DNN-HMM声学模型应用到视频云笔记的语音听写笔记记录中,并采用TF-IDF-G算法对笔记内容进行分析,提取笔记内容热点。实验表明,DNN-HMM声学模型和TF-IDF-G算法能够有效改善互联网教育的视频学习机制,从而提高学习者的学习热情和效率。
【学位单位】:西安电子科技大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:G434;TP393.09
【部分图文】:

在线教育


1.1 研究背景和意义近年来,在传统教学的基础上,人们越来越重视互联网在线学习,它正在逐渐深入人们的日常学习和生活中。从 CNNIC 在 2019 年 2 月发布的第 43 次《中国互联网络发展状况统计报告》显示[2],截止去年十二月,中国在线教育用户人数达到 2.01 亿,比 2017 年年底增加 4605 万,年增长率为 29.7%。同时,随着在线学习的便捷及终身学习思想的普及,在线教育的用户市场规模在持续发展,如图 1.1 所示。目前互联网教育已经实现全球范围的资源共享和平台开放,使得学习者可以随时随地在网络上学习自己所需的教学资源,给教育行业带来了很大的压力和新的发展动力。教育形式也由最初单一的文本、音频材料走向丰富的视频资源。但是,在学习资源显著增加和网络环境显著改善的背后,新的挑战也随之诞生。学习者的学习效果并没有发生质的变化,学习者虽然可以方便快捷的获得所需资源,但只是被动接受信息,不能有效利用,无法及时构建知识体系,这也对学习者理解学习资源内容造成了极大的困难,在一定程度上对学生的“学”过程有所忽略。

核心需求,产品发展,产品


云笔记的市场需求正在逐渐增加。目前,市场上的云笔记产品层出不穷,功能也是各式各样,其三大核心需求如图1.2 所示。现在市场上的笔记工具基本可以分为两种:独立式笔记和嵌入式笔记。独立式笔记比如印象笔记、有道笔记,其主要功能是私人记事、生活记录。这类笔记工具功能比较完善,但是没有紧密联系在线学习,学习者不能实时将笔记和学习资源对应起来。因此这类笔记在网络学习中不太受欢迎。嵌入式笔记是指将笔记工具集成到学习平台上中,这类笔记工具有一个共同的的缺点就是单一的文本记录形式,不支持语音记录功能。图 1.2 云笔记核心需求国内云笔记产品还处于薄弱阶段的同时,国外云笔记产品发展却很占优势。比如印象笔记,是由美国云笔记服务商开发的,之后,印象笔记中文版打入中国市场,使得“云笔记”这一概念众所周知。云笔记最大的特点是为用户提供随时随地搜索、总结信息并同步到多个平台的功能。但是通过研究统计,市场上云笔记的用户还比较少,总计仅有千万,同类产品种类也很少,还没有明显的竞争现象。1.2.2 语音识别研究现状20 世纪 50 年代是语音识别研究的萌芽期,第一个建立在特定人、6 英尺高自动数字识别的 Audrey 系统[5],成功用于对 10 个英文数字的识别,准确度高达 90%

原理图,连续语音识别,原理图


图 2.1 连续语音识别原理图1、信号预处理:对输入的原始语音进行预处理,去除语音中的冗余信息。2、特征提取:提取若干可以代表一段语音信息,描述信号本质的信息特征值。3、声学模型:使用语音数据库训练声学模型,将特征提取后的语音与声学模型进行匹配,转换成有序的拼音输出。4、语言模型:语言模型结合词语所处上下文的语义环境和语法,描述出词与词之间的内在关联[15],提高识别的准确率,将拼音转化为文字。5、解码器:在构建的网络中利用搜索算法找出一条最优的路径,以最大可能性输出识别出来的语句。综上,在语音识别的过程,首先对输入语音信号进行去除噪音等处理,提取能表示原始语音信号的特征,然后将上一步得到的语音特征与声学模型、语言模型训练和匹配,最后构建一个庞大的识别搜索网络,根据搜索算法在该网络中寻找出一条最优的路径,以最大可能性输出识别出来的语句,从而将语音识别为文字。语音识别的本质可以理解为,输入语音信号,找出对应语句中概率最大的句子。

【相似文献】

相关期刊论文 前10条

1 周弘烨;;语音识别大揭秘:计算机如何处理声音?[J];中国新通信;2019年04期

2 程建军;胡立志;;关于深度学习的语音识别应用研究[J];科技经济导刊;2019年12期

3 桑亚超;李龙杰;袁传青;霍庆磊;张乐;;关于语音识别在空调上的应用与改善[J];日用电器;2019年07期

4 牛洪波;王婉君;刘华楠;;语音识别专利技术综述[J];河南科技;2019年24期

5 向晖;;数字语音识别与合成[J];电子世界;2019年15期

6 张晗;;浅谈语音识别[J];内蒙古科技与经济;2019年18期

7 马晓伟;;基于智能声控需求的语音识别研究[J];通讯世界;2019年10期

8 姜姝姝;;语音识别64年大突破[J];机器人产业;2016年06期

9 吴俊宇;;语音识别为何“叫好不叫座”?[J];通信世界;2016年16期

10 徐鑫;;语音识别的未来之路[J];通信世界;2016年16期

相关会议论文 前10条

1 张冰;龙长才;罗海风;;熟悉掩蔽音背景下的目标语音识别[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年

2 于东;贾磊;徐波;;面向语音识别错误恢复的澄清式疑问句生成[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

3 邢安昊;黎塔;颜永红;;利用二重打分方法的激活词语音识别[A];中国声学学会第十届青年学术会议论文集[C];2013年

4 文成义;何海燕;张玉扶;;基于新型神经网络的不定人语音识别[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年

5 杜笑平;杨启纲;杨家沅;;过零周期转移概率矩阵语音识别部件的研制[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年

6 潘胜昔;刘加;江金涛;王作英;陆大金;;基于多模式及集成判决的稳健电话语音识别算法研究[A];第五届全国人机语音通讯学术会议(NCMMSC1998)论文集[C];1998年

7 杜利民;;语音识别中的鲁棒性问题[A];第六届全国人机语音通讯学术会议论文集[C];2001年

8 宋君;葛余博;;应用于鲁棒语音识别的置信度加权特征丢失法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

9 张明新;倪宏;陈国平;张东滨;;一种用于并行模型噪声鲁棒语音识别的特征构造方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年

10 熊军军;马瑞堂;李成荣;;儿童语音识别的研究现状[A];第九届全国人机语音通讯学术会议论文集[C];2007年

相关重要报纸文章 前10条

1 特约撰稿人 Lamont Wood 编译 Charles;语音识别成长起来,并走向移动应用[N];计算机世界;2018年

2 本报记者 陶力;阿里全资收购先声互联 推动语音识别场景落地[N];21世纪经济报道;2018年

3 洪蕾;阿里研发高工业噪声环境下语音识别及传输技术[N];中国信息化周报;2018年

4 本报记者 郭科;登月早已实现,同期启动的语音识别还在路上[N];科技日报;2018年

5 本报记者 王星平;语音识别商用尴尬 应用场景垂直化路有多远[N];中国企业报;2016年

6 本报记者 余建华;从“绿皮车时代”迈入“高铁时代”[N];人民法院报;2017年

7 陈宗周;机器在聆听[N];电脑报;2017年

8 本报记者 黄旭 熊雯琳;云知声:与巨头共舞,成为AI领域BAT的密码[N];电脑报;2017年

9 本报记者 钱一彬;手机“黑科技”为何叫好不叫座[N];人民日报;2017年

10 《机器人产业》杂志副总编辑 姜姝姝;语音识别距人类只差0.4%?[N];北京日报;2017年

相关博士学位论文 前10条

1 谭天;基于结构化深度学习的语音识别自适应技术研究[D];上海交通大学;2018年

2 屠彦辉;复杂场景下基于深度学习的鲁棒性语音识别的研究[D];中国科学技术大学;2019年

3 贺苏宁;基于语音识别基元声学整体结构特征的识别模型研究[D];电子科技大学;2005年

4 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年

5 徐金甫;基于特征提取的抗噪声语音识别研究[D];华南理工大学;2000年

6 宁更新;抗噪声语音识别新技术的研究[D];华南理工大学;2006年

7 沈海峰;语音识别中的环境补偿研究[D];北京邮电大学;2006年

8 李小兵;高效简约的语音识别声学模型[D];中国科学技术大学;2006年

9 孙f

本文编号:2814678


资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/ktjx/2814678.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b0d2f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com