MOOCs背景下基于行为特征的学习者流失问题研究
发布时间:2021-02-09 01:11
随着互联网信息技术的发展,大规模在线开放课程(MOOCs)作为一种的新的教学方式,在国内开始迅速兴起和发展,但普遍存在着学习效果不佳或学习者大量流失等问题,阻碍了MOOCs的持续发展。为了解决MOOCs中存在的问题,需要大量关于MOOCs的研究,深入理解MOOCs下的学习者,能实时掌握学习者学习状态和情况,对于课程教师和平台管理者来说都是极为有利的。其中通过对客观存在的学习者行为数据分析来理解学习者是很有研究价值和意义的。本文对楚课联盟平台下的学习者展开研究,充分利用了平台中已有数据,对在线学习行为进行分析和预测,首先结合相关行为理论,对平台下学习者进行了行为活动属性分析,然后针对MOOCs中学习者流失问题,进行了影响因素分析并建立行为数据模型,提取并确定30个具体且全新的学习者行为特征,然后运用逻辑回归求得各行为活动的特征系数并分析得出了若干个强关联性的行为特征,最后了另一种概率图模型-隐马尔可夫模型进行了预测对比分析,验证并评估了模型得预测精度和可行性。本文研究结果说明了基于学习者行为特征对MOOCs流失问题研究是很有价值的,为之后更加深入挖掘学习者的学习行为属性和规律提供了参考。...
【文章来源】:武汉纺织大学湖北省
【文章页数】:55 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数函数()的值有特殊含义,表示预测结果为正标签1(即流失)的概率,其值在0
图 4.4 P-R 曲线示意图4 中所示为查准率与查全率曲线示意图,其中横坐标表示为查全率称“P-R 曲线”。从图中可以很直观的看出模型在样本数据集上的中一共显示了 A,B,C 三条曲线,如果一个曲线完全在另一个曲者的模型性能优于后者,例如图中所示曲线 A 完全包住了曲线 C,显优于模型 C;当两个曲线相互交叉的时候,一般不能这么直接判通过比较具体的查准率或查全率,就是比较 P-R 曲线下面积的大小模型查准率和查全率取得相对高的比例,但是这个不容易估算,所能度量就是“平衡点”(Break-Event Point,BEP)。图中虚线表示查值,这条虚线与三条曲线均有一个交点即平衡点,比较平衡点的取模型 A 的性能优于模型 B。OC 和 AUC
图 4.5 ROC 曲线示意图ROC(Receiver Operating Characteristic)曲线是显示分类(Classification)模型真率和假正率之间折中的一种图形化方法。ROC 曲线的面积就是 AUC(Area Under tCurve)。AUC 常用于评估“二分类问题”算法性能也就是模型泛化能力。使用模型测样本产生一个预测概率值,然后将预测值与分类阈值进行比较,若大于阈值则分为正类小于阈值则分为反类。这个概念叫“截断点”。利用模型对测试样本进行预测分类后,以得到各测试样本属于某类别的相似度概率。比如样本 D1属于 A 类别的概率为 0.3一般认为预测分类概率低于 0.5,D1就属于类别 B。这里的 0.5,就是“截断点”即类阈值。随着分类阈取值的不同,计算 TPR 和 FPR 的结果就会不同。将不同取值下对应的 TPR 和 FPR 结果点,将结果点画在二维坐标上会得到一条线叫做 ROC 曲线,轴用 Falsepositiverate 即 FPR 表示,纵轴用 Truepositiverate 即 TPR 表示,ROC 曲线意图如图 4.5 表示。4.5 交叉验证一般建立模型是不会将所有数据集都应用于训练模型,因为模型建立之后,需要
【参考文献】:
期刊论文
[1]开放教育资源的可持续发展:现状、问题及趋势[J]. 杨满福. 中国电化教育. 2013(06)
[2]让MOOCs更有意义:在谎言、悖论和可能性的迷宫中沉思[J]. 约翰·丹尼尔,王志军,赵文涛. 现代远程教育研究. 2013(03)
[3]大学生网络学习行为分析及改进策略[J]. 张林泉. 广西教育学院学报. 2012(04)
本文编号:3024798
【文章来源】:武汉纺织大学湖北省
【文章页数】:55 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数函数()的值有特殊含义,表示预测结果为正标签1(即流失)的概率,其值在0
图 4.4 P-R 曲线示意图4 中所示为查准率与查全率曲线示意图,其中横坐标表示为查全率称“P-R 曲线”。从图中可以很直观的看出模型在样本数据集上的中一共显示了 A,B,C 三条曲线,如果一个曲线完全在另一个曲者的模型性能优于后者,例如图中所示曲线 A 完全包住了曲线 C,显优于模型 C;当两个曲线相互交叉的时候,一般不能这么直接判通过比较具体的查准率或查全率,就是比较 P-R 曲线下面积的大小模型查准率和查全率取得相对高的比例,但是这个不容易估算,所能度量就是“平衡点”(Break-Event Point,BEP)。图中虚线表示查值,这条虚线与三条曲线均有一个交点即平衡点,比较平衡点的取模型 A 的性能优于模型 B。OC 和 AUC
图 4.5 ROC 曲线示意图ROC(Receiver Operating Characteristic)曲线是显示分类(Classification)模型真率和假正率之间折中的一种图形化方法。ROC 曲线的面积就是 AUC(Area Under tCurve)。AUC 常用于评估“二分类问题”算法性能也就是模型泛化能力。使用模型测样本产生一个预测概率值,然后将预测值与分类阈值进行比较,若大于阈值则分为正类小于阈值则分为反类。这个概念叫“截断点”。利用模型对测试样本进行预测分类后,以得到各测试样本属于某类别的相似度概率。比如样本 D1属于 A 类别的概率为 0.3一般认为预测分类概率低于 0.5,D1就属于类别 B。这里的 0.5,就是“截断点”即类阈值。随着分类阈取值的不同,计算 TPR 和 FPR 的结果就会不同。将不同取值下对应的 TPR 和 FPR 结果点,将结果点画在二维坐标上会得到一条线叫做 ROC 曲线,轴用 Falsepositiverate 即 FPR 表示,纵轴用 Truepositiverate 即 TPR 表示,ROC 曲线意图如图 4.5 表示。4.5 交叉验证一般建立模型是不会将所有数据集都应用于训练模型,因为模型建立之后,需要
【参考文献】:
期刊论文
[1]开放教育资源的可持续发展:现状、问题及趋势[J]. 杨满福. 中国电化教育. 2013(06)
[2]让MOOCs更有意义:在谎言、悖论和可能性的迷宫中沉思[J]. 约翰·丹尼尔,王志军,赵文涛. 现代远程教育研究. 2013(03)
[3]大学生网络学习行为分析及改进策略[J]. 张林泉. 广西教育学院学报. 2012(04)
本文编号:3024798
本文链接:https://www.wllwen.com/jiaoyulunwen/jykj/3024798.html