基于贝叶斯神经网络的深度知识追踪方法研究
发布时间:2021-09-13 20:15
近年来,在教育信息化、远程教育和web2.0等应用带动下,在线教育得到快速发展。当前的在线教育并不是完全以用户为中心,并不能根据用户的认知水平和认知风格,为每个用户提供最适合的优质教育资源,进行个性化指导,从而做到因材施教。实现因材施教的前提是了解用户的认知水平。知识追踪模型(Knowledge Tracing,KT)根据用户的学习指标推断用户知识的事实标准,模拟在技能获取过程中用户不断变化的知识状态。现有的知识追踪模型在模拟学生知识获取过程存在特征考虑不全、效果不佳和易过拟合等问题。为更好建模学生学习,追踪学生知识获取过程,本文提出了基于贝叶斯神经网络的深度知识追踪方法。本文主要是探讨不同的贝叶斯神经网络在深度知识追踪上的运用,研究工作如下:(1)为避免因样本数据形成的模型过拟合现象和少量噪声数据对模型的影响,将贝叶斯方法和LSTM相结合,让模型置信区间的计算成为可能,增强模型泛化能力和抗噪能力,提出了基于贝叶斯-LSTM的深度知识追踪方法。通过实验验证贝叶斯神经网络在知识追踪上的有效性。在模型中引入学生行为向量学习,挖掘学生答题行为间及知识点间关系。(2)针对LSTM结构不能并行计...
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
论文组织结构
10于贝叶斯-LSTM的深度知识追踪模型主要包含三个部分:基于嵌入层(Embeddng)的学习行为记录向量化,挖掘行为间向量关系;基于贝叶斯-LSTM的时序特征抽取层,发掘学生学习过程中的知识信息转移;输出映射层,将挖掘的时序特征数据映射到各个知识点,获取各个知识点掌握情况和接下来各个知识点题目答对概率。模型结构如图2-1所示。图2-1基于贝叶斯-LSTM的深度知识追踪模型结构2.1.1基于Embedding的学生行为编码学生的学习记录包含其做题的知识点和相应的对错信息等信息,信息包含文本、数据等复杂形式。在利用神经网络进行深度知识追踪时,需要将学生行为记录数字化向量化编码。借鉴自然语言处理中的词嵌入(WordEmbedding)思想[36],引入嵌入层(Embedding)得到学生行为向量。常用的向量化编码表示有两种:独热表示(One-hotRepresentation)和分散式表示(DistributedRepresentation)。独热表示是一个稀疏向量,向量中与一个有效位的值为1,其他值均为零。例如:“知识点A答对”表示为[00010000000000…]“知识点B答对”表示为[00000010000000…]这种向量表示可直接区分两个不同的行为,在任意两个向量间的距离都是相同的,各种行为间也完全独立,并不能展现出各种学习行为间的关系。而且随着学习知识点的增多,向量的维度过高,模型参数和计算量增大,不利于模型参数的训练。分散式表示不仅很好的区分学习行为,而且可以反应出学习行为间关系。分散式表示每一位都有值,都有效。对于每一个学习行为都有一个唯一的分散式表示。分散式表示可根据实际需求设定分散式向量的维度,可有效地降低独
11热表示带来的数据维度过高的影响。学习行为间关系较为复杂,其分散式表示并不能直接给出。在自然语言处理中,词向量分散式表示可通过中间层——嵌入层训练得到。为得到学习行为的分散表示,在模型结构中输入层之后加入嵌入层。在训练知识追踪模型的同时,得到学习行为的向量分散式表示。根据学习行为的标号可找到与其对应的分散式向量表示,如图2-2所示,通过向量间的欧式距离可得到学习行为间的相似关系,也间接地反映了知识点间的关系。图2-2学习行为编码图示嵌入层根据知识追踪的任务导向,训练学习行为的分散式表示,降低了数据维度和模型计算的复杂度,可有效的提高知识追踪模型的准确度,同时,为后续对学生行为关系分析和知识点间关系提供了量化的数据。2.1.2基于贝叶斯-LSTM的时序特征抽取RNN在处理时序数据有着优良的表现,RNN允许信息持久化,在NLP和语音识别均有良好的效果[37-38]。而学生行为数据是具有时序的数据,RNN在知识追踪上有着巨大潜力。将RNN运用于学生知识追踪,成为近年来的研究知识追踪的一种趋势。但RNN等神经网络的典型训练需要大量的标记数据来控制过拟合的风险。对于较小的训练数据,数据的高频特性往往使神经网络更容易陷入过拟合。贝叶斯神经网络是解决这一问题的一种有原则的方法。利用RNN的特性,可很好的抽取学习时序数据的特征。RNN模型按时间展开结构如图2-3所示,从结构中可看出,RNN的参数是共享的,可通过输入先
【参考文献】:
期刊论文
[1]知识追踪模型在教育领域的应用:2008—2017年相关研究的综述[J]. 李菲茗,叶艳伟,李晓菲,史丹丹. 中国远程教育. 2019(07)
[2]基于贝叶斯知识跟踪模型的慕课学生评价[J]. 王卓,张铭. 中国科技论文. 2015(02)
[3]大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J]. 徐鹏,王以宁,刘艳华,张海. 远程教育杂志. 2013(06)
[4]自适应学习系统学习者学习风格模型的研究现状与展望[J]. 高虎子,周东岱. 电化教育研究. 2012(02)
[5]基于“态度”的知识追踪模型及集成技术[J]. 闾汉原,申麟,漆美. 徐州师范大学学报(自然科学版). 2011(04)
[6]数据挖掘技术在教育中的应用研究[J]. 杨永斌. 计算机科学. 2006(12)
博士论文
[1]面向基础教育的自适应学习服务系统研究与应用[D]. 廖轶.北京交通大学 2017
本文编号:3395272
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
论文组织结构
10于贝叶斯-LSTM的深度知识追踪模型主要包含三个部分:基于嵌入层(Embeddng)的学习行为记录向量化,挖掘行为间向量关系;基于贝叶斯-LSTM的时序特征抽取层,发掘学生学习过程中的知识信息转移;输出映射层,将挖掘的时序特征数据映射到各个知识点,获取各个知识点掌握情况和接下来各个知识点题目答对概率。模型结构如图2-1所示。图2-1基于贝叶斯-LSTM的深度知识追踪模型结构2.1.1基于Embedding的学生行为编码学生的学习记录包含其做题的知识点和相应的对错信息等信息,信息包含文本、数据等复杂形式。在利用神经网络进行深度知识追踪时,需要将学生行为记录数字化向量化编码。借鉴自然语言处理中的词嵌入(WordEmbedding)思想[36],引入嵌入层(Embedding)得到学生行为向量。常用的向量化编码表示有两种:独热表示(One-hotRepresentation)和分散式表示(DistributedRepresentation)。独热表示是一个稀疏向量,向量中与一个有效位的值为1,其他值均为零。例如:“知识点A答对”表示为[00010000000000…]“知识点B答对”表示为[00000010000000…]这种向量表示可直接区分两个不同的行为,在任意两个向量间的距离都是相同的,各种行为间也完全独立,并不能展现出各种学习行为间的关系。而且随着学习知识点的增多,向量的维度过高,模型参数和计算量增大,不利于模型参数的训练。分散式表示不仅很好的区分学习行为,而且可以反应出学习行为间关系。分散式表示每一位都有值,都有效。对于每一个学习行为都有一个唯一的分散式表示。分散式表示可根据实际需求设定分散式向量的维度,可有效地降低独
11热表示带来的数据维度过高的影响。学习行为间关系较为复杂,其分散式表示并不能直接给出。在自然语言处理中,词向量分散式表示可通过中间层——嵌入层训练得到。为得到学习行为的分散表示,在模型结构中输入层之后加入嵌入层。在训练知识追踪模型的同时,得到学习行为的向量分散式表示。根据学习行为的标号可找到与其对应的分散式向量表示,如图2-2所示,通过向量间的欧式距离可得到学习行为间的相似关系,也间接地反映了知识点间的关系。图2-2学习行为编码图示嵌入层根据知识追踪的任务导向,训练学习行为的分散式表示,降低了数据维度和模型计算的复杂度,可有效的提高知识追踪模型的准确度,同时,为后续对学生行为关系分析和知识点间关系提供了量化的数据。2.1.2基于贝叶斯-LSTM的时序特征抽取RNN在处理时序数据有着优良的表现,RNN允许信息持久化,在NLP和语音识别均有良好的效果[37-38]。而学生行为数据是具有时序的数据,RNN在知识追踪上有着巨大潜力。将RNN运用于学生知识追踪,成为近年来的研究知识追踪的一种趋势。但RNN等神经网络的典型训练需要大量的标记数据来控制过拟合的风险。对于较小的训练数据,数据的高频特性往往使神经网络更容易陷入过拟合。贝叶斯神经网络是解决这一问题的一种有原则的方法。利用RNN的特性,可很好的抽取学习时序数据的特征。RNN模型按时间展开结构如图2-3所示,从结构中可看出,RNN的参数是共享的,可通过输入先
【参考文献】:
期刊论文
[1]知识追踪模型在教育领域的应用:2008—2017年相关研究的综述[J]. 李菲茗,叶艳伟,李晓菲,史丹丹. 中国远程教育. 2019(07)
[2]基于贝叶斯知识跟踪模型的慕课学生评价[J]. 王卓,张铭. 中国科技论文. 2015(02)
[3]大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J]. 徐鹏,王以宁,刘艳华,张海. 远程教育杂志. 2013(06)
[4]自适应学习系统学习者学习风格模型的研究现状与展望[J]. 高虎子,周东岱. 电化教育研究. 2012(02)
[5]基于“态度”的知识追踪模型及集成技术[J]. 闾汉原,申麟,漆美. 徐州师范大学学报(自然科学版). 2011(04)
[6]数据挖掘技术在教育中的应用研究[J]. 杨永斌. 计算机科学. 2006(12)
博士论文
[1]面向基础教育的自适应学习服务系统研究与应用[D]. 廖轶.北京交通大学 2017
本文编号:3395272
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3395272.html