基于深度学习的教学场景语言模型研究

发布时间:2021-12-28 05:15
  随着大数据、深度学习的快速发展,作为语言的两个基本属性,语音和文本的研究有了突破性进展。语言是教学场景中最主要的信息交流方式,因此文本和语音的研究对于教育+AI有着重要的意义。作为文本和语音研究中的一项基石工作,语言模型(Language Model,LM)主要应用于语音识别、拍照搜题、机器翻译、智能语音对话等教育+AI领域。目前,语言模型在训练语料相对充足的智能客服等垂直领域已经取得了比较理想的效果。然而,对于语言模型在教学场景中的研究和应用学术界着墨不多,主要有两个原因,一是数据壁垒,高质量的面向教学场景的语料积累太少;二是教学场景的数据有其自身的特点:首先教学场景的语言具有独特的话术性,如老师讲课常用的话术、中英文数字结合等;第二,教学场景的语言具有知识点名词专业性,如数学、物理、化学等学科的专有名词;第三,教学场景中老师、学生的语言通常具有口语化的特点;第四,教学场景具有领域综合性,老师讲课会涉及到其他领域的知识,其目的是把知识点更好地传达给学生。因此,专门针对教学场景训练一个高性能的语言模型势在必行。本论文主要针对教学场景的数据设计并实现了基于深度学习的教学场景语言模型,并完... 

【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校

【文章页数】:65 页

【学位级别】:硕士

【部分图文】:

基于深度学习的教学场景语言模型研究


语言模型在教学场景中主要应用示意图

示意图,语言模型,功能,示意图


于基础和核心的研究地位。但是面向教学场景的语言模型由于教学场景数据的缺、教学场景话术的独特性、教学场景知识点的名词专业性、教学场景语言口化和教学场景领域综合性等原因,业界暂未出现一个高性能的语言模型。所以门针对教学场景进行语言模型研究具有重要的意义。.2 语言模型及研究现状语言模型其主旨是描述自然语言内在固有规律的数学模型,应用在各个需要句子序列进行概率评估的任务中,是文本处理和语音信号处理的重点和基石。言模型的功能就是用来计算不同词语组成一个句子的概率,利用语言模型可以断哪个单词序列出现的可能性更大、更加符合人说话的可能性。此外,语言模也可以通过给定若干个单词序列,预测下一个最可能出现的单词。声学模型、言模型和解码器构成了一个完整的语音识别引擎,语言模型就是对解码器解码的众多可能结果进行概率评估,概率最大的那个单词序列即为识别出的文本。言模型功能图如图 1-2 所示。

基于深度学习的教学场景语言模型研究


语言模型发展历程图


本文编号:3553472

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3553472.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户745c1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com