基于数据分析的自适应学习系统研究
发布时间:2021-08-09 04:05
在线教育在互联网快速发展的今天,已经逐渐发展成现代人们学习的一种新途径。以慕课为代表的在线教育平台在近几年成为包括在校生及在职人士的重要学习平台。基于互联网技术的在线教育平台使得大量学习行为数字化,方便了规模化自动化的通过计算机技术分析学习行为,以此辅助教师的教学,给学生及时的反馈。我们通过好大学在线提供的脱敏在线平台用户行为数据进行分析,基于学习行为提供更好的教学学习建议,实现在在线教育平台上的自适应学习。然而在实际的工业数据中,情况较理想的数据集差别较大,数据的复杂性和稀疏性造成了模型学习的困难。本论文我们主要关注的是如何通过实际的学习行为数据对学生的学习效率进行预测。通过特征工程处理包括学生基本信息,测验信息,课程视频观看信息以及论坛交互信息这四种主要的用户信息,并通过在不同模型上的比较,提出在稀疏数据上较优的模型,并且通过自然语言处理技术提升模型的预测准确性,从而实现通过用户数据反馈用户的学习效率,为教师及学生提供相应的教学和学习建议。我们比较了不同类别的特征对学习者学习效率的影响,最后得到了最优模型测试准确率为65.27%,同时还尝试了对时序特征测验信息进行校正,对文本特征进...
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
–1项目反应理论
其中 称为激活函数,常见的激活函数有sigmoid tanh ReLU[27]。将多个的神经元相互连接,就可以组成各种结构的人工神经网络。一般的,神经网络结构如图2–2所示,主要分为三种神经网络层:输入层,隐藏层和输出层。图 2–2 人工神经网络结构图Fig 2–2 Artificial Neural Network神经网络常常需要在大量的数据上进行训练,要训练多层神经网络需要较为强大的学习算法,最经典的是反向传播算法(Back Propagation,简称 BP)[28]。由于神经网络的特性,常常容易过拟合,而正则化(Regularization)[29][30] 和随机丢弃(Dropout)[31] 可以防止过拟合以提高模型泛化能力。由于经典的全连接神经网络需要训练的参数较多,有些特殊结构的神经网络如卷积神经网络(Convolutional Neural Network,简称 CNN)[32
信息的聚合。然后我们统计每个学生的文本集对应的统计特征,如内容长度和帖子数量。细粒度的用户特征向量具有 400 个特征。图3–2描绘了随机抽样的 250 名学习者的归一化测验特征向量。从图中可以很容易地发现,在线教育平台的细粒度测验用户特征向量的稀疏性是相当普遍的。特征稀疏性在其他类型的特征中也是常见的情况。我们相信模型能够捕捉所有这些特征之间的相互关系,而不论特征的稀疏性如何。图 3–2 采样了 250 名学生的测验特征向量的热力图。大多数特征向量包含少量有效特征。每列代表一个用户测验特征向量Fig 3–2 The heatmap of sampled 250 students’test feature vectors. Most feature vectors contain few validfeatures. Each column represents a user test feature vector— 24 —
【参考文献】:
期刊论文
[1]慕课发展及其对开放大学的启示[J]. 殷丙山,李玉. 北京广播电视大学学报. 2013(05)
本文编号:3331331
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
–1项目反应理论
其中 称为激活函数,常见的激活函数有sigmoid tanh ReLU[27]。将多个的神经元相互连接,就可以组成各种结构的人工神经网络。一般的,神经网络结构如图2–2所示,主要分为三种神经网络层:输入层,隐藏层和输出层。图 2–2 人工神经网络结构图Fig 2–2 Artificial Neural Network神经网络常常需要在大量的数据上进行训练,要训练多层神经网络需要较为强大的学习算法,最经典的是反向传播算法(Back Propagation,简称 BP)[28]。由于神经网络的特性,常常容易过拟合,而正则化(Regularization)[29][30] 和随机丢弃(Dropout)[31] 可以防止过拟合以提高模型泛化能力。由于经典的全连接神经网络需要训练的参数较多,有些特殊结构的神经网络如卷积神经网络(Convolutional Neural Network,简称 CNN)[32
信息的聚合。然后我们统计每个学生的文本集对应的统计特征,如内容长度和帖子数量。细粒度的用户特征向量具有 400 个特征。图3–2描绘了随机抽样的 250 名学习者的归一化测验特征向量。从图中可以很容易地发现,在线教育平台的细粒度测验用户特征向量的稀疏性是相当普遍的。特征稀疏性在其他类型的特征中也是常见的情况。我们相信模型能够捕捉所有这些特征之间的相互关系,而不论特征的稀疏性如何。图 3–2 采样了 250 名学生的测验特征向量的热力图。大多数特征向量包含少量有效特征。每列代表一个用户测验特征向量Fig 3–2 The heatmap of sampled 250 students’test feature vectors. Most feature vectors contain few validfeatures. Each column represents a user test feature vector— 24 —
【参考文献】:
期刊论文
[1]慕课发展及其对开放大学的启示[J]. 殷丙山,李玉. 北京广播电视大学学报. 2013(05)
本文编号:3331331
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3331331.html