基于学生画像和课程相似度的学生成绩预测模型
发布时间:2022-11-03 20:11
“智慧校园”是校园发展的必然趋势,从分散的信息化数据中挖掘出有效信息,促进校园活动的发展,是十分重要的。学生成绩是衡量学生个人能力和教师教学水平的最重要因素,提前预测学生课程成绩能够对学生和教师起到提前预警、及时纠正的作用,学生成绩预测也是教育数据挖掘中最重要的一个方向。但是现有的学生成绩预测研究中,大部分研究的数据量普遍较少,研究方向不适用我国教育情况,同时传统教育数据挖掘研究里对学生成绩的预测很少考虑到课程之间隐含的关联。针对以上问题,本文通过学生的相关数据信息,研究预测学生的后续成绩。研究的数据来源于浙江大学城市学院14级-17级学生个人统计数据和学生成绩单,基于这些数据,本文经过国内外现状研究和实验,提出了两个预测学生成绩的回归模型和一个融合模型。首先提出了基于学生画像特征库的CART回归树的学生成绩预测模型,使用学生的成绩数据和个人信息数据进行学生成绩的预测。在建模过程中,结合数据集中的学生人口统计数据,运用特征工程来对学生的特征进行分析,找出有用信息建立“学生画像”特征库,使用CART回归树模型建立基于学生画像的成绩预测模型。根据已有数据进行的实验证明了构建的学生画像特征库...
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题背景与意义
1.2 国内外研究现状
1.3 论文研究内容与创新点
1.4 论文组织结构
第2章 课题相关关键理论与技术概述
2.1 教育数据挖掘
2.1.1 数据挖掘概念
2.1.2 教育数据挖掘概述
2.1.3 EDM的研究方向
2.1.4 学生成绩预测的研究方法
2.2 回归常用算法概述
2.3 协同过滤
2.3.1 协同过滤的概念
2.3.2 协同过滤分类
2.4 模型融合
2.4.1 模型融合的概念
2.4.2 模型融合的方法
2.5 回归性能评价指标
2.6 本章小结
第3章 基于学生画像的CART回归树成绩预测模型
3.1 CART回归树模型的基本理论
3.1.1 回归树
3.1.2 CART回归算法基本原理
3.2 学生画像特征库构建
3.2.1 数据集成
3.2.2 数据预处理
3.2.3 特征提取
3.2.4 特征库筛选与描述
3.3 实验
3.3.1 数据集描述
3.3.2 模型评估与分析
3.4 本章小结
第4章 基于课程相似度的混合多权值Slope-one算法
4.1 Slope-one算法的基本思想
4.1.1 基于项目的协同过滤基本原理
4.1.2 基本Slope-one算法原理
4.1.3 加权Slope-one算法原理
4.2 课程相似度计算
4.2.1 课程名分词
4.2.2 TF-IDF关键词权重计算
4.2.3 基于余弦的课程相似度计算
4.2.4 课程相似度计算流程
4.3 混合改进的多权值Slope-one算法
4.3.1 改进的多权值Slope-one算法
4.3.2 引入基于项目的协同过滤
4.3.3 改进的混合多权值Slope-one算法
4.4 实验
4.4.1 实验数据描述
4.4.2 实验步骤
4.4.3 实验评估和分析
4.5 本章小结
第5章 基于学生画像和课程相似度的融合模型
5.1 融合模型的设计
5.2 模型融合方法
5.3 实验
5.3.1 实验数据
5.3.2 权重确定
5.3.3 实验结果评估与分析
5.4 本章小结
第6章 总结和展望
参考文献
攻读硕士学位期间主要的研究成果
致谢
本文编号:3700551
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题背景与意义
1.2 国内外研究现状
1.3 论文研究内容与创新点
1.4 论文组织结构
第2章 课题相关关键理论与技术概述
2.1 教育数据挖掘
2.1.1 数据挖掘概念
2.1.2 教育数据挖掘概述
2.1.3 EDM的研究方向
2.1.4 学生成绩预测的研究方法
2.2 回归常用算法概述
2.3 协同过滤
2.3.1 协同过滤的概念
2.3.2 协同过滤分类
2.4 模型融合
2.4.1 模型融合的概念
2.4.2 模型融合的方法
2.5 回归性能评价指标
2.6 本章小结
第3章 基于学生画像的CART回归树成绩预测模型
3.1 CART回归树模型的基本理论
3.1.1 回归树
3.1.2 CART回归算法基本原理
3.2 学生画像特征库构建
3.2.1 数据集成
3.2.2 数据预处理
3.2.3 特征提取
3.2.4 特征库筛选与描述
3.3 实验
3.3.1 数据集描述
3.3.2 模型评估与分析
3.4 本章小结
第4章 基于课程相似度的混合多权值Slope-one算法
4.1 Slope-one算法的基本思想
4.1.1 基于项目的协同过滤基本原理
4.1.2 基本Slope-one算法原理
4.1.3 加权Slope-one算法原理
4.2 课程相似度计算
4.2.1 课程名分词
4.2.2 TF-IDF关键词权重计算
4.2.3 基于余弦的课程相似度计算
4.2.4 课程相似度计算流程
4.3 混合改进的多权值Slope-one算法
4.3.1 改进的多权值Slope-one算法
4.3.2 引入基于项目的协同过滤
4.3.3 改进的混合多权值Slope-one算法
4.4 实验
4.4.1 实验数据描述
4.4.2 实验步骤
4.4.3 实验评估和分析
4.5 本章小结
第5章 基于学生画像和课程相似度的融合模型
5.1 融合模型的设计
5.2 模型融合方法
5.3 实验
5.3.1 实验数据
5.3.2 权重确定
5.3.3 实验结果评估与分析
5.4 本章小结
第6章 总结和展望
参考文献
攻读硕士学位期间主要的研究成果
致谢
本文编号:3700551
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3700551.html