当前位置:主页 > 硕博论文 > 社科博士论文 >

面向MOOCs的学习行为与情感分析

发布时间:2021-07-10 04:23
  今春突发的新冠肺炎疫情是对我国在线教育的一次重大考验,在疫情防控期间各类学校开展各种形式的在线教学工作,实现了“停课不停学”的目标,这表明进一步推进在线教育发展的必要性和重要性。大规模开放在线课程(Massive Open Online Courses,MOOCs)作为在线教育的一种形式,以其不受时空限制等诸多优势,近年来吸引了大量学习者,发展迅速。然而,由于宽松的学习环境,目前面向MOOCs的学习存在以下两个问题:课程辍学率较高和学习者学习效果较差。研究表明,学习行为和情感是影响辍学和学习效果的重要因素。面向MOOCs的学习行为和情感分析是新型教育环境下降低辍学率、改善学习效果的突破口,迅速成为当前研究热点。虽然已经涌现出诸多相关研究,面向MOOCs的学习行为和情感分析在实际应用中,仍然面临以下挑战:第一,在辍学行为预测方面,采用不同的学习行为特征预测结果不同,可能导致预测结果波动较大,识别准确率较低。第二,在学习行为和学习效果分析方面,目前大多研究重点关注学习行为和学习效果的相关关系分析,缺乏因果关系分析,导致分析的结论不可靠,无法提供有效的决策支持。第三,在情感分析方面,有监督的... 

【文章来源】:西北大学陕西省 211工程院校

【文章页数】:133 页

【学位级别】:博士

【部分图文】:

面向MOOCs的学习行为与情感分析


辍学行为预测的实验结果

模型图,特征选择,性能,模型


第二章面向网络日志的辍学行为预测29表2.5平均训练时间(秒)方法DT-ELMTALSTMGA-ELM时间1.63832.427>1003.3649根据实验结果,在整体性能方面,DT-ELM五周的平均准确率和F1值分别达到89.29%和91.49%,优于对比方法在这两个指标上的五周平均值,且它的平均训练时间为1.6383秒,在所有类别中用时最少。具体地,TA在两个指标上的结果最低,LSTM较TA在整体性能上有一定提升,但它的训练时间大于100秒,在所有方法中用时最长,开销过大。GA-ELM的结果优于LSTM,略低于DT-ELM。根据实验结果,第四周和第五周的预测结果高于其他几周。为了分析原因,我们对每周的辍学率进行统计分析,与前三周相比,最后两周的平均辍学率更高,这意味着学习者的行为模式更容易识别,另一方面也说明了辍学预测研究的重要性,辍学率在课程后期普遍高于课程初期。因此,为了进行有效的干预,首先需要准确地识别有辍学风险的学习者。从算法时间复杂度方面分析,DT-ELM结合了决策树和ELM,C4.5算法的时间复杂度为,其中为样本数,为输入的特征数[75]。ELM的算法时间复杂度为,其中为隐含神经元个数[76]。因此,DT-ELM的时间复杂度等于C4.5和ELM的时间复杂度相加之和。尽管DT-ELM的时间复杂度高于一些对比算法,如LG的时间复杂度为,但从预测准确率和训练开销整体考虑,DT-ELM的预测效果较对比算法有一定优势。2.5.4特征选择对模型性能的影响为了验证特征选择的有效性,本文对比了DT-ELM和ELM的实验结果,如图2.4所示。图2.4特征选择对模型性能的影响

模型图,性能,模型,课程


西北大学博士学位论文30DT-ELM在两个指标上的实验结果优于ELM,结果表明,特征选择提高了辍学行为预测的结果,用较少的特征进行辍学行为预测比用所有学习行为特征进行预测取得更好的实验结果,选择尽可能多的学习行为特征并不能达到最佳的预测结果。根据前面提到的熵理论,具有不同的信息增益比的学习行为特征具有不同的分类能力,具有低增益比值的学习行为特征可能会削弱模型的预测能力。2.5.5特征增强和连接初始化对模型性能的影响为了验证特征增强对模型的有效性,我们将DT-ELM与其去掉特征增强功能的方法Without-FE进行比较。类似地,为了验证连接初始化对模型的有效性,我们将DT-ELM与其去掉连接初始化功能的方法Without-IC进行了比较。三种方法的实验结果如图2.5所示。根据实验结果,DT-ELM的实验结果均高于Without-FE和Without-IC,验证了特征增强和连接初始化对模型性能的有效性。Without-IC方法的实验结果在两个指标上均高于Without-FE方法,说明特征增强对模型在提升预测准确性方面的贡献大于连接初始化。图2.5特征增强和连接初始化对模型性能的影响2.5.6训练集大小对模型性能的影响为了验证训练集大小对模型性能的影响,我们设计了两组实验,第一组(DT-ELM-SE)包括在10门课程中注册人数最少的5门课程,注册人数从几百人到约一千人,第二组(DT-ELM-LE)包括注册人数最多的5门课程,注册人数从几千人到上万人,我们使用本文提出的模型在这两组课程数据上分别进行实验,结果如图2.6所示。根据实验结果,用于模型训练的数据越多,分类结果越好。在时间方面,DT-ELM-LE和DT-ELM-SE的平均训练时间分别为1.6752秒和1.6014秒,差异不大。尽管模型在注册人数较少的课程上的预测结果低于注册人数较多的课程,但整体结果仍高于第一组

【参考文献】:
期刊论文
[1]数据挖掘视角下网络学习者行为特征聚类分析[J]. 王改花,傅钢善.  现代远程教育研究. 2018(04)
[2]网络评论方面级观点挖掘方法研究综述[J]. 韩忠明,李梦琪,刘雯,张梦玫,段大高,于重重.  软件学报. 2018(02)
[3]情感分类研究进展[J]. 陈龙,管子玉,何金红,彭进业.  计算机研究与发展. 2017(06)
[4]基于行为序列分析对在线学习参与模式的探索[J]. 李爽,钟瑶,喻忱,程罡,魏顺平.  中国电化教育. 2017(03)
[5]基于非时序观察数据的因果关系发现综述[J]. 蔡瑞初,陈薇,张坤,郝志峰.  计算机学报. 2017(06)
[6]因果关系及其在社会媒体上的应用研究综述[J]. 赵森栋,刘挺.  软件学报. 2014(12)
[7]基于MOOC数据的学习行为分析与预测[J]. 蒋卓轩,张岩,李晓明.  计算机研究与发展. 2015(03)
[8]基于句法与主题扩展的中文微博情感倾向性分析模型[J]. 陆浩,牛振东,张楠,孙星恺,刘文礼.  北京理工大学学报. 2014(08)
[9]行为科学理论指导下的高校大学生网络学习行为研究[J]. 刘中宇,周晓.  中国电化教育. 2008(05)

博士论文
[1]面向e-Learning的学习者情感建模及应用研究[D]. 黄焕.华中师范大学 2014



本文编号:3275180

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/sklbs/3275180.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b4892***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com