当前位置:主页 > 教育论文 > 学生管理论文 >

面向大规模在线课程的辍学率预测研究

发布时间:2020-07-07 06:05
【摘要】:随着互联网和教育大数据的快速发展,大规模在线课程已经越来越普及,国内外都出现了大量的慕课平台,注册人数都达到了上百万,并且平台注册人数会越来越多,但是据调查统计发现课程的完成率普遍低下,关于如何降低慕课平台学习者的辍学率成为亟待研究的问题。尽管大量的学者对该问题进行了理论和预测模型方面的分析,但是研究基础都是基于小样本数据进行研究,很少考虑大数据环境下的时效性。本文基于师大学堂慕课平台研究慕课用户的辍学率问题,在用户行为特征构建和用户辍学率预测模型构建两个方面进行一系列的研究,给出了基于大数据环境慕课用户辍学率预测的新思路,研究的主要内容主要包含下面三个方面:1)基于分布式的权重SVM预测模型基于慕课平台数据量大和实时的特性,分析师大学堂用户的行为数据特性,采用ELK架构设计了慕课平台的数据收集机制,其中Logstash和Elasticsearch都具备良好的可扩展性,随着慕课平台的扩大,数据收集管道也可以扩展,Logstash在数据收集中可以自定义组件对数据进行清洗,结合Elasticsearch和Kibana可以高效的对数据进行存储和统计等操作,根据研究现状和师大平台的用户行为特性分析用户的行为属性,进一步统计用户行为数据,得出用户行为的特征矩阵。基于分布式环境和SVM分类器,设计分布式SVM,并且在此基础之上加入特殊的权重矩阵,对模型的数据进行优化,提高不平衡数据的可识别度,进一步提升模型的准确度和训练效率,其中的核心算法在本文中简称PW-SVM。2)用户特征权重模型和PW-SVM实现由于试验数据具有一定的不均衡特性,为了提高模型的训练效率和准确率,充分分离样本点,使用层次分析法对构建用户特征权重矩阵,再进一步将矩阵加入到分布式SVM模型中。支持向量机(SVM)在训练线性不可分和高纬度等小样本数据时具备良好的效果,在应用到大数据环境下,传统的SVM的计算效率会极大的下降,针对该问题,已有大量文献提出了分布式SVM算法,包括Spark框架中内置了 SVM算法,但是该算法是基于线性分类器设计的,对非线性样本数据训练会存在一定的缺陷,在此基础之上,本文基于分布式P-pack SVM算法和用户权重模型,实现了基于Spark的非线性SVM算法PW-SVM,理论上算法的效率会随着节点的增加而提高。3)实验分析本文最后对模型进行实验分析,实验分析分为两个部分,分别用小样本数据和大样本数据对LibSVM、MllibSVM和PW-SVM做对比实验,在试验之前,先进行试验分析PW-SVM算法的最佳参数。第一组实验结果表明PW-SVM在小样本训练时耗时较长,但是仍然具备一定的准确度,说明了模型的可用性;第二组实验利用数十万的大样本进行对比实验,发现PW-SVM在训练时间上比LibSVM的效率高,并且比MlibSVM中线性的训练方式准确度好,说明在大数据环境下,PW-SVM拥有更好的效果。进一步基于师大学堂的课程行为数据,利用PW-SVM进行训练,由于该数据集具备不均衡的特点,最后发现在添加权重矩阵之后,模型训练收敛的速度回更快,准确率也有相应的提升,说明不均衡数据在经过权重矩阵计算之后,再利用SVM训练会有更好的效果,进一步说明该方法在慕课用户辍学率预测上面有一定的借鉴意义,可以为相关的教学决策作数据支撑。
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:G434
【图文】:

分类问题,基本的,文档,索引


逦Hadoop邋HDFS逦Amazon邋S3逡逑图2-1-2邋Elasticsearch技术架构图逡逑其中重点说明下功能层中的索引模块(IndexModel),这个是ES中比较重要的逡逑模块,ES在建立索引的时候采用倒排索引(Invertedindex)邋[19]的机制,这和传统的逡逑数据库是完全不一样的,所以ES在检索的效率上比传统的数据库高很多,ES的索逡逑引结构如下图所示,其中包含段、文档、域和项,他们之间相互包含。逡逑段一I逦文档一I逦域一I逦项逡逑——?逦——?邋逦?逡逑段逦文档域逦项逡逑索引逦段逦文档逦域逡逑图2-1-3邋ES索引关系逡逑2.1.3邋Kibana逡逑Kibanaf^是一个开源的分析和可视化平台,可以与ES高度集成,可以使用逡逑9逡逑

线性不可分,拉格朗日函数,核函数,式子


心学位论文逡逑MASTER'S邋THESIS逡逑机在这种非线性的分类中拥有巨大的优势,在解决非线性的分类映射函数,该函数可以对低维度数据进行映射,将非线性转化为在这样的函数,一定能够构造出映射函数,将低炜度线性不可分可分,这个函数称为核函数。逡逑

基本组件,程序,算子,操作类别


/^?\耻学位论文逡逑MASTER'S邋THESIS逡逑不仅可以批量创建RDD,还可以对任意内存位置进行读写,可以实现高效的容错,逡逑对于计算失效的部分,不需要回滚操作,只需要重新计算丢失部分的RDD分区即逡逑可。BlockManager用数据块来抽象大量的数据,存储在内存或者磁盘,在计算中如逡逑果数据不在本节点,就复制其他节点的数据进行计算。在物理上存储上,RDD是一逡逑种元数据结构,保存数据的元数据信息,类似于Hadoop中存在namenode上的数逡逑据,存储形式如图3所示。RDD的创建方式可以从Hadoop文件系统或者其他的持逡逑久化存储系统,如hive、cassandra、Hbase等输入创建也是一种常用的方式,对RDD逡逑的操作类别主要包括两个算子:Transformation算子(变换)与Action算子(行动),逡逑Spark为了降低系统内存的使用频率,使用迟延的执行方式,当只有操作累计到逡逑Action算子时,Transformation算子才会把一个RDD转换为另外一个RDD;邋Action逡逑算子会正真触发整个操作序列的执行,中间的结果不会重新分配内存,而是在同一逡逑个数据块上进行流水线操作。逡逑RDD1

【相似文献】

相关期刊论文 前10条

1 陈健;孙庆梅;;青海省农村牧区中小学 春季收费规范 中学生辍学率下降[J];青海统计;2006年09期

2 ;本市初中毕业生届巩固率逐年提高,届辍学率逐年下降[J];北京教育;1997年Z2期

3 道俊;;昭阳区教育局狠抓控辍保学工作[J];云南教育(视界时政版);2017年04期

4 都丽萍;;对辍学率反弹问题的几点认识[J];中小学管理;2005年12期

5 樊树权;农民增收:辍学率何以升高?[J];农村天地;2005年06期

6 郑宏;不能仅用“年辍学率”来评价“控辍”工作[J];中小学管理;2004年01期

7 毕永良;农村初中辍学率回升现象透析[J];中小学管理;2003年12期

8 李守纪;“辍学率受到影响”?[J];语文建设;2003年01期

9 ;1995年与2000年小学生辍学情况比较[J];教育发展研究;2001年12期

10 张武中;中小学生辍学原因的分析与思考[J];青海师专学报;1999年S1期

相关会议论文 前10条

1 袁宇迪;;让孩子带着期盼去上学[A];2016年国家教师科研专项基金科研成果[C];2016年

2 简荣华;;山区初中学生辍学的原因及对策[A];中华教育理论与实践科研论文成果选编(第2卷)[C];2010年

3 杨奎;;搞好寄宿学校管理有利于控辍保学[A];中华教育理论与实践科研论文成果选编(第1卷)[C];2009年

4 金延春;;再谈实质性解决“控辍”问题的思路与对策[A];创新沈阳文集(B)[C];2009年

5 夏成元;;马关县壮族、苗族学生“辍学”情况的调研与思考[A];全国教育科研“十五”成果论文集(第一卷)[C];2005年

6 黄彤哲;;中小学辍学原因及对策[A];全国教育科研“十五”成果论文集(第一卷)[C];2005年

7 刘海涛;聂衍刚;;大学生无聊倾向与网络成瘾、人格特质的相关研究[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年

8 姚延芹;;武汉市“流动儿童”义务教育状况调查——从“上学难”到“上好学校难”转变的思考[A];2007年中国教育经济学年会会议论文集[C];2007年

9 麻付上;;农村初中生流失原因初探[A];基础教育理论研究成果荟萃(中)[C];2006年

10 陈明昆;张晓楠;姚娇娇;;埃塞俄比亚初等教育发展取得的成就及面临的问题与挑战[A];非洲研究2017年第1卷(总第10卷)[C];2017年

相关重要报纸文章 前10条

1 记者 韦继川 通讯员 郭超前;江南区建档立卡学生辍学率降零[N];广西日报;2019年

2 中国教育科学研究院高等教育研究中心博士 姜朝晖;“慕课”高辍学率亦不妨理性看待[N];中国教育报;2014年

3 本报记者 赵婀娜 张烁;辍学率低于国家控制线[N];人民日报;2012年

4 华东师大发展规划办公室及教育管理学系教授 文新华;小学辍学率大大低于十年前[N];中国教育报;2013年

5 新华社记者 王进业 文远竹;警惕:农村辍学率上升[N];中国教育报;2001年

6 民进中央副主席 王立平;努力降低农村初中辍学率[N];光明日报;2001年

7 旅美华人 山石;美国学生辍学率为何“雷人”的高?[N];新华每日电讯;2011年

8 耿 汉;由40%的高辍学率想到……[N];中国信息报;2004年

9 湖北省南漳县政协 李传友;2104名初中生为何辍学了[N];人民政协报;2001年

10 ;一个都不能少[N];人民政协报;2005年

相关硕士学位论文 前10条

1 占高强;面向大规模在线课程的辍学率预测研究[D];华中师范大学;2018年

2 刘小红;中职生辍学成因及其教育对策研究[D];上海师范大学;2010年

3 刘原媛;民族地区初中生辍学原因分析及对策[D];四川师范大学;2013年

4 叶小红;农村普通高中辍学现象的调查与分析[D];华中师范大学;2006年

5 王静;信阳市职业高中隐性辍学的成因及对策研究[D];华中师范大学;2012年

6 孙远;庄河农村初中生辍学现状的调查分析及对策[D];辽宁师范大学;2006年

7 陈林;基层电大现代远程教育辍学情况探究[D];华中师范大学;2006年

8 伍琪;基于马斯洛需要层次理论的农村中学生辍学原因分析与对策研究[D];四川师范大学;2017年

9 陈凤;温江区中职学生辍学原因及对策研究[D];四川师范大学;2014年

10 刘露阳;美国学院高中项目研究[D];东北师范大学;2013年



本文编号:2744748

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/xueshengguanli/2744748.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6e8d2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com