基于深度网络的MOOC辍学预测算法研究
发布时间:2020-07-08 06:07
【摘要】:随着互联网在各个领域的不断普及,传统的教育教学模式正在发生改变。自2012年大规模开放在线课程——慕课(Massive Open Online Courses,MOOC)诞生以来,吸引了越来越多的人参与学习,但高辍学率却给MOOC平台教学的管理带来不便。预测学习者的辍学行为,有助于提升学习者的学习效果以及实现MOOC平台更多的价值。本文从MOOC学习者的学习行为特征出发,提出了3种基于深度网络的辍学预测算法,主要研究内容如下:(1)提出了一种基于卷积神经网络和长短期记忆(Long Short-Term Memory based on Convolutional Neural Network,CNN-LSTM)网络的辍学预测模型。针对现有的MOOC辍学预测模型依赖于特征工程提取特征,预测效果存在不稳定、性能欠佳等问题,该模型采用一种自动特征提取策略,无需特定领域知识和人工干预,同时考虑了学生行为特征的长期依赖信息,提高了模型的预测能力。实验结果表明,该模型与基于LSTM、CNN-RNN的辍学预测方法相比,分别将AUC提高了2.7%、1.4%。(2)提出了一种基于丰富卷积特征的长短期记忆(Long Short-Term Memory based on Richer Convolutional Features,RCF-LSTM)网络的辍学预测模型。针对时间跨度大、特征粗粒度、未能充分利用CNN丰富的层次特征等问题,该模型将粒度更精细的行为特征作为输入,同时还有效地融合每个CNN层的细粒度特征。实验结果表明,相较于CNN-RNN和CNN-LSTM辍学预测模型,该模型的AUC值分别提高了0.29%和0.25%。(3)提出了一种基于CNN-LSTM-SVM网络的辍学预测模型。针对训练参数多、耗费内存以及数据类别非均衡等问题,综合考虑了学生行为的局部特征和序列化特征,同时对不同类别设置不同的权重,解决了非均衡数据对预测结果的影响。该模型结构简单,相较于RCF-LSTM网络模型的辍学预测算法,AUC提升了5.54%。本文的研究表明基于深度网络的辍学预测模型,可以预测学生不同时刻的行为状态变化,有助于教师提供及时的干预措施,提升学习者的学习效果,对促进我国教育信息化快速发展具有重要的指导意义。
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP183
【图文】:
长的学习活动,估计学习者在未来一周内停止参加课程的可能性。表 1 MOOC 中“辍学”的定义文献 描述DEF1 [6][19] 最后一周的参与情况:学生是否会坚持到课程结束。DEF2 [13][15][16][17] 参与的最后一周:本周是否是学生活动的最后一周。DEF3 [34] 下周参与:学生在接下来的周是否有活动。.2 面向辍学预测的 CNN-LSTM 网络模型的构建本章采用 CNN-LSTM 网络模型来预测和分析辍学问题。其中模型包含了一层和一层池化,用于自动特征提取。考虑到 CNN 处理高维特征的高效性以及提取的有效性,本文采用单层 CNN 自动提取学习者的行为特征,训练模型的最佳参数自动筛选出有效的行为特征。而 LSTM 网络被用作辍学预测的模型,以确定学不同的时间步长内是否辍学。图 3 展示了 CNN-LSTM 模型的网络结构图。
步长内学习者的输入特征是从一周内的所有学习活动生成的。根辍学定义,本章采取学生的堆叠周特征进行训练和预测模型。其中为:在第 T 周使用的特征向量是通过将第 T 周之前的所有周的特特征之上形成的,其捕获自课程开始以来学生的累积活动相关信k1xk2yk3ykTyk1yk2xk3xkTx标签行为活动week 1 week 2 week 3 week T图 7 学生 k 第 T 周的辍学预测问题示意图学生k在 T周内的行为特征序列( )以及相应的辍学 ),其中 T 表示学生参加课程的周数,如图 7 所示。对于当学生 k 在下周有活动,则认为 j 周的辍学标签为 = ,否则为
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP183
【图文】:
长的学习活动,估计学习者在未来一周内停止参加课程的可能性。表 1 MOOC 中“辍学”的定义文献 描述DEF1 [6][19] 最后一周的参与情况:学生是否会坚持到课程结束。DEF2 [13][15][16][17] 参与的最后一周:本周是否是学生活动的最后一周。DEF3 [34] 下周参与:学生在接下来的周是否有活动。.2 面向辍学预测的 CNN-LSTM 网络模型的构建本章采用 CNN-LSTM 网络模型来预测和分析辍学问题。其中模型包含了一层和一层池化,用于自动特征提取。考虑到 CNN 处理高维特征的高效性以及提取的有效性,本文采用单层 CNN 自动提取学习者的行为特征,训练模型的最佳参数自动筛选出有效的行为特征。而 LSTM 网络被用作辍学预测的模型,以确定学不同的时间步长内是否辍学。图 3 展示了 CNN-LSTM 模型的网络结构图。
步长内学习者的输入特征是从一周内的所有学习活动生成的。根辍学定义,本章采取学生的堆叠周特征进行训练和预测模型。其中为:在第 T 周使用的特征向量是通过将第 T 周之前的所有周的特特征之上形成的,其捕获自课程开始以来学生的累积活动相关信k1xk2yk3ykTyk1yk2xk3xkTx标签行为活动week 1 week 2 week 3 week T图 7 学生 k 第 T 周的辍学预测问题示意图学生k在 T周内的行为特征序列( )以及相应的辍学 ),其中 T 表示学生参加课程的周数,如图 7 所示。对于当学生 k 在下周有活动,则认为 j 周的辍学标签为 = ,否则为
【参考文献】
相关期刊论文 前3条
1 李曼丽;徐舜平;孙梦Z
本文编号:2746184
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2746184.html