当前位置:主页 > 科技论文 > 软件论文 >

MOOC用户流失率的统计建模和预测技术的研究

发布时间:2018-05-05 01:02

  本文选题:MOOC + 用户流失率 ; 参考:《北京邮电大学》2016年硕士论文


【摘要】:随着互联网的发展,在线教育蓬勃发展,形式越来越多。MOOC作为在线教育的一种形式,以其学习成本低等优点被越来越多的人接受。但是MOOC面临着一个十分重要的问题:用户流失率过高。这对MOOC的发展十分不利。本文使用了 MOOC网站提供39门课程的用户后台操作数据,对MOOC用户的行为模式进行分析。在此基础上对用户流失率进行建模,实现对MOOC用户是否丢弃课程进行预测。本论文使用的数据集已标注好对应的预测结果(丢弃和不丢弃)。所以对用户流失率建模是一个有监督的二分类问题,可以使用机器学习分类理论来对用户流失率进行建模和预测。论文在分析数据集的基础上,共提出了三类特征,其中有描述性质的特征,也有统计性质的特征,这些特征集合可以从多个角度反映MOOC用户的行为习惯,最大限度地保留了原数据集的信息。接着,论文使用了逻辑回归、支持向量机、随机森林、梯度提升树和AdaBoost分类模型分别对用户流失率进行建模。结合数据集,论证了这五种分类模型的预测性能,同时也指出了分类模型存在的不足:单一的分类模型只能反映数据集一个维度的信息。针对各分类模型独自建模所存在的无法全面反映数据集的不足,论文首先提出了一种多分类器加权联合考虑的思想,并在此基础上给出一种基于分类器权重的改进模型。多分类器加权模型是一种多分类器组合模型,通过加权的方式来组合分类模型,以解决单一分类器不能充分反映数据集的情况。接下来,论文又讨论了一种基于阈值的多分类器与模型,获得一个预测度很高的可信集合。最后,融合多分类器加权模型和可信集合概念,给出一种带有可信集合的加权改算法,进一步提高了流失率模型的预测性能。
[Abstract]:With the development of the Internet, online education is booming, more and more forms of.MOOC as a form of online education are accepted by more and more people with the advantages of low cost of learning. But MOOC is facing a very important problem: the rate of user loss is too high. This is very bad for the development of MOOC. This article uses the MOOC website to provide 3 The users of the 9 courses operate data in the background to analyze the behavior patterns of MOOC users. On this basis, the user churn rate is modeled to predict whether the MOOC users are discarded. The data set used in this paper has been marked with the corresponding prediction results (discarding and discarding). The two classification problem of supervision can be used to model and predict the loss rate of users by machine learning classification theory. On the basis of the analysis of data sets, a total of three types of features are presented, including the characteristics of the description and the characteristics of statistical properties. These feature sets can reflect the behavior habits of MOOC users from multiple angles. Then, the paper uses logical regression, support vector machines, random forests, gradient lifting trees and AdaBoost classification models to model the loss rate of users respectively. The prediction performance of the five classification models is demonstrated by combining data sets, and the shortcomings of the classification models are also pointed out: single The classification model can only reflect the information of one dimension of the data set. In view of the inadequacy of the data sets that can not be fully reflected in the modeling of each classification model, a new idea of weighted joint consideration of multiple classifiers is proposed in this paper, and an improved model based on the weight of classifier is given on this basis. A multi classifier combination model is used to combine the classification model by weighted method so as to solve the case that single classifier can not fully reflect the data set. Then, a multi classifier and model based on threshold is discussed, and a trusted set with high predictability is obtained. Finally, the multiple classifier weighted model and the trusted set are fused. In addition, a weighted modification algorithm with credible sets is proposed to further improve the prediction performance of the churn rate model.

【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:G434;TP181

【相似文献】

相关期刊论文 前10条

1 蒋晨;发展和留住核心用户——电信业用户流失分析[J];邮电企业管理;2001年13期

2 方蕾;;用户流失引发网游颓势 提升服务是唯一救命稻草[J];IT时代周刊;2006年05期

3 肖胜;;准确计算与解读流失率[J];通信企业管理;2013年01期

4 马凤炯;;以优质服务推动邮政企业持续发展[J];中国邮政;2009年09期

5 刘光远;苑森淼;董立岩;李永丽;;基于进化理论的用户流失预测分析[J];吉林大学学报(理学版);2007年02期

6 庄德尚;武艳;;新疆巴州铁通 建立流失预警机制 减少用户流失[J];通信企业管理;2007年12期

7 赖院根;刘砺利;;基于客户价值的信息用户流失预测研究[J];情报理论与实践;2011年07期

8 ;为IPOT witter效仿FACEBOOK[J];工业设计;2013年08期

9 马会迎;;移动互联网对用户流失的影响分析——以人人网为例[J];无线互联科技;2014年04期

10 宋向东;;IP业务推动NTT固话公司走出困境[J];通信世界;2011年05期

相关会议论文 前4条

1 车平;施刚;;一种基于决策树的用户流失预测分析方法[A];先进制造技术论坛暨第五届制造业自动化与信息化技术交流会论文集[C];2006年

2 俞宙;莫丽珍;;广东移动天气短信用户流失分析及应对[A];第31届中国气象学会年会S10 第四届气象服务发展论坛——提高水文气象防灾减灾水平,推动气象服务社会化发展[C];2014年

3 崔乔礼;邵淑娟;;国内普通高校如何面对和利用“幕课(MOOC)”资源[A];辽宁省高等教育学会2013年学术年会暨第四届中青年学者论坛论文摘要集[C];2013年

4 许南阳;马铁明;;试探MOOC促进教育国际化背景下的高等教育教学质量保障[A];辽宁省高等教育学会2013年学术年会暨第四届中青年学者论坛论文摘要集[C];2013年

相关重要报纸文章 前10条

1 本报记者 梓茎;用户流失:一个不容忽视的问题[N];人民邮电;2003年

2 本报记者 席大伟;中电信手机用户流失缓解 天翼彰显发展后劲[N];通信信息报;2009年

3 中兴通讯 曾志 杨毅;借助大数据盘活“存量市场”[N];通信产业报;2013年

4 ;用户流失:带号转移政策的挑战[N];人民邮电;2008年

5 ;NTTDoCoMo用户流失加剧[N];人民邮电;2007年

6 李薇;防用户流失,AT&T推出“免费通信”[N];新华每日电讯;2007年

7 本报记者 于伟;美国有线和卫星电视用户流失加快宽带互联网替代效应凸显[N];通信信息报;2011年

8 北京商报记者 李立勋;热钱追捧的MOOC靠什么回应质疑[N];北京商报;2014年

9 李雷 穆童;焦作联通建档维系防用户流失[N];人民邮电;2010年

10 本报记者 荆戈;从MOOC课程到一本大众图书[N];新华书目报;2014年

相关硕士学位论文 前10条

1 刘文彦;MOOC用户流失率的统计建模和预测技术的研究[D];北京邮电大学;2016年

2 张迪;移动游戏用户流失因素分析[D];南京大学;2016年

3 代晓菊;基于数据挖掘的电信LTE用户上网数据的用户流失算法研究[D];西南交通大学;2016年

4 尹丹丹;移动通信网用户流失预测[D];中国科学技术大学;2016年

5 孔立佳;双边平台应对用户流失问题的发展战略研究[D];浙江师范大学;2016年

6 郑杰文;基于Spark平台的通信网用户流失预测研究[D];中国科学技术大学;2017年

7 王娟;联通某地市分公司用户流失分析及对策研究[D];北京邮电大学;2010年

8 曹洁;A电信分公司移动用户流失分析与对策研究[D];山东大学;2011年

9 刘道坚;MOOC教学模式研究[D];华南理工大学;2015年

10 宋文;MOOC在我国高校本土化建设初探[D];中央民族大学;2015年



本文编号:1845471

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1845471.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户916c0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com