基于K-Means的慕课用户行为分析研究
发布时间:2019-09-20 01:55
【摘要】:随着“互联网+教育”的全民普及,慕课(大规模在线开放课程)的发展如火如茶,为人们接受在线教育提供了一个广阔的平台,而国内慕课的实践研究远早于理论研究,众多慕课平台纷纷涌现。慕课用户的知识背景和学习动机呈多样性分布,并在学习的过程中产生丰富的学习行为数据,为了探索蕴含在数据中的规律,针对不同的用户群体提供个性化的环境和学习指导,分析和研究用户的行为数据是十分有必要的。聚类分析是一种常用的探索性数据挖掘方法,是无监督机器学习的典型应用,不仅可以用于分类数据的多元统计分析,也可以为其他算法提供预处理。在研究和归纳用户行为分析方法的基础上,本文选择K-Means算法进行聚类分析,通过进行算法的优化和构建成绩预测模型,成功实现了慕课用户的成绩预测,并构建成绩预测模块,实现成绩预测值的可视化展示。本文的主要研究工作有:(1)基于慕课用户行为数据,对用户的学习行为数据的基本信息、用户类型、影响成绩的因素等三个方面进行深入地分析和探索,得出一些相关结论。(2)本文利用特征选择和初始聚类中心的优化选取算法,提出了一种K-Means特征选择算法,并提出一个均衡判别函数平衡类簇内差异和类簇间差异。(3)将K-Means特征选择算法得到的聚类中心作为神经网络的中心,设置预测模型的参数和输入输出变量,选择RBF神经网络构建一个成绩预测模型,并动态更新该模型,以更为准确地实现成绩的预测。本文设计了仿真实验验证算法的高效性,对比K-Means特征选择算法和基于密度的K-Means算法,证明了本文算法性能的改进。同时,使用仿真实验证明了成绩预测模型对慕课用户的成绩具有较高的预测精度。最后利用预测模型设计和实现了一个成绩预测模块,可以直观地输出用户的成绩预测值,并对成绩较低的用户进行预警、建议和辅导。
【图文】:
逦邋Table邋3-2邋Age邋Distribution邋of邋Users逦逡逑区间序号逦年龄分布区间逦逦逡逑1逦{19-34}逦14574逦19-34岁的用户数量逡逑2逦{34-54}逦16923逦34-54岁的用户数量逡逑3逦{55邋or邋older}逦5583逦55岁以上的用户数量逡逑逦4逦{}逦288119逦属性为空的用户数量逡逑如表3-2所示,年龄分布于34岁到54岁的人数最多,占比45.6%,其次分布逡逑于19岁到34岁,最后是分布于55岁以上的用户数量,仅有5583条数据。前两逡逑个区间的用户数量差距不大,但是远远高于后者区间的用户数量。这说明,慕课逡逑用户偏年轻化,熟悉网络平台,有强烈的求知欲和学习目标。逡逑(2)教育水平分析逡逑慕课用户的教育水平分布能够在一定程度上解释慕课的用户群体,如图3-1逡逑所示,慕课用户主要集中于学士学历和硕士学历,占用户数量的83.4%,而博士逡逑学历和中学及以下学历的人群占比极少,这说明慕课所吸引的用户基本都是接受逡逑过良好的高等教育,,且慕课流行于拥有较高文化水准的人群中。逡逑
图3-2用户的参与原因逡逑Figure邋3-2邋Reasons邋for邋Participation邋of邋Users逡逑
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13
【图文】:
逦邋Table邋3-2邋Age邋Distribution邋of邋Users逦逡逑区间序号逦年龄分布区间逦逦逡逑1逦{19-34}逦14574逦19-34岁的用户数量逡逑2逦{34-54}逦16923逦34-54岁的用户数量逡逑3逦{55邋or邋older}逦5583逦55岁以上的用户数量逡逑逦4逦{}逦288119逦属性为空的用户数量逡逑如表3-2所示,年龄分布于34岁到54岁的人数最多,占比45.6%,其次分布逡逑于19岁到34岁,最后是分布于55岁以上的用户数量,仅有5583条数据。前两逡逑个区间的用户数量差距不大,但是远远高于后者区间的用户数量。这说明,慕课逡逑用户偏年轻化,熟悉网络平台,有强烈的求知欲和学习目标。逡逑(2)教育水平分析逡逑慕课用户的教育水平分布能够在一定程度上解释慕课的用户群体,如图3-1逡逑所示,慕课用户主要集中于学士学历和硕士学历,占用户数量的83.4%,而博士逡逑学历和中学及以下学历的人群占比极少,这说明慕课所吸引的用户基本都是接受逡逑过良好的高等教育,,且慕课流行于拥有较高文化水准的人群中。逡逑
图3-2用户的参与原因逡逑Figure邋3-2邋Reasons邋for邋Participation邋of邋Users逡逑
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13
【参考文献】
相关期刊论文 前10条
1 孙利雷;秦进;;基于随机扰动的K-Means聚类中心优化方法[J];贵州大学学报(自然科学版);2016年04期
2 贺超凯;吴蒙;;edX平台教育大数据的学习行为分析与预测[J];中国远程教育;2016年06期
3 孙丙仁;杨敏;;基于机器学习聚类算法的学习者自动分类研究[J];天津电大学报;2016年02期
4 贾瑞玉;宋建林;;基于聚类中心优化的k-means最佳聚类数确定方法[J];微电子学与计算机;2016年05期
5 姜丹;王美娜;周丽;;基于聚类分析技术的智能型MOOC平台的研究与设计[J];现代计算机(专业版);2016年13期
6 孙洪涛;李秋R
本文编号:2538475
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2538475.html