当前位置:主页 > 科技论文 > 自动化论文 >

基于机器学习的高校学生成绩预测方法研究

发布时间:2022-01-06 09:42
  教育数据挖掘是一个综合了教育心理学、计算机科学和统计学等多学科的新兴交叉研究领域。它旨在基于教育领域内不断累积的海量数据资源,运用机器学习、数据挖掘、统计与可视化等相关技术和方法来分析和挖掘其中的内在规律,以期解决教育教学过程中的各种潜在问题,进而提升教育质量。学生成绩预测是教育数据挖掘领域的热点研究问题之一,其目的是基于学生的相关信息预测其未来的学习表现,例如:分数、排名、考核等级等。近年来,随着高校的持续扩招,在校生人数逐年增多,因而课堂教学的规模也越来越大,以致于教师很难跟踪了解每一位学生的学习情况,从而在一定程度上影响了教学质量。与此同时,各高校每年都有一定数量的学生出现考试不及格、留级、甚至退学现象,这严重影响了学生的未来发展。在这种背景下,研究构建高效的学生成绩预测方法具有重要的应用价值和实践意义。此前,许多学者已对学生成绩预测开展了部分卓有成效的工作。但是,现有的工作仍存在一些不足和尚待解决的挑战性问题,主要体现在以下三个方面:1)现有研究在进行课程成绩预测时大多依赖学生在课程进行中的表现信息,例如:出勤情况、作业完成情况和课程阶段性考核成绩等,导致需要在课程开始一段时间... 

【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:106 页

【学位级别】:博士

【部分图文】:

基于机器学习的高校学生成绩预测方法研究


图1-1本文研宄技术路线图??如图1-1所示,本文主要开展了以下三个方面的研宄:??1.提出了一种基于课程关联性的学生成绩预测方法

示例,学生,样本,课程


学生样本被表示为包含多个课程示例并同时拥有多个标记的数据形式,即:??&?=?{足,扮。??多示例的表示形式?多标记同时预测??广?、?f?、??完成课程1学时夢分::课程性质[*:*?J成新学期待预测课程|??!,?—?j?傳?t ̄J??完成课程2学时学分课程样质l?成?多?々?|〔新翔龍H賴2〕|??|??!??!学生样杉?!?!??(完成课程《,?学时 ̄孥分课程性质|:?-成绩)?|?f新学期待预测课程j??V?,?丨、?>??图3-1多示例多标记的学生样本表示??3.2.2?问题的形式化表示??在本章中,用大写字母(如:X)表示集合,黑体小写字母(如:x)表示??向量,非黑体小写字母(如:x)表示标量;用符号;f和J;分别表示样本输入??空间和输出空间。斜体大写字母T表示矩阵的转置操作,除非特别指定,向量??默认为列向量。表3-1中给出了本章所定义的变量及其含义。??因为本文基于学生以往课程学习表现来预测下一学期各科课程的学习情??况。如表3-1所示,令符号(表示学期数量。高等教育培养计划中,专科学制??一般为3年,本科学制4年,对应的i值分别为6和8。令符号p表7F目标学??期,即在此学期开设的课程为预测对象。因为第一学期之前没有开设任何课程,??所以本文把第二学期作为最初的目标学期,故有2?St。需要注意的是,由??于高等教育中不同专业的课程设置不相同,因此,本文把不同专业学生的课程??成绩预测工作视为不同的任务。对于某个专业的建模任务,给定目标学期p,??25??

学期,数据集,性能,课程


多示例的表示形式和多门课??程同时建模均给模型性能带来一定程度的提升。??3.3.5课程信息量对模型性能的影响??如前所述,本文利用学生课程历史信息来预测其在新学期课程上是否有不??及格风险。由于第一学期之前不存在己完成课程信息,本研宄从第二学期开??始建立课程成绩预测模型,此时只有第1个学期的课程信息可用,课程数量??往往只是个位数。随着学生学习过程的推进,课程信息量逐渐增多,为了解课??程信息量对方法性能的影响,本小节中,以学期为单位展示并分析各方法在??每个数据集上的性能。图3-2、图3-3和图3-4分别给出了各个方法在数据集??BCS08—11、BET08—11?和?GIM08」0?上的综合指标?macro-i^.s?的值。??il^MANN??I?EiiBLR??0.8?-?I?-?FFi週?SVM??、?〇?Ir!????:?n?Jljp?1?lL??D?r>,?:?[t]?llj]?II?fl?I?m?Citation-KNN??C?|?JI?1?:?[?l?1?ML-kNN??A?In!?I?I?|?:?|?Our?method??r?|?y?il?I?r?fl??Term2?Term3?Term4?Term5?Term6?Temi7?Term8??图3-2不同学期各方法在数据集BCS08_11上的性能比较??从图3-2、图3-3和图3-4可以看出,在macro-巧.5指标上,本文方法在??多数情况下取得了最优的性能。尤其在预测第2学期的课程时,由于可用课??程的信息量较少,大多数传统单示例单标记方法的性能较差,即:在三组数??据上的macroi^值均低于0.6。然而

【参考文献】:
期刊论文
[1]当代大学生学习动机的特征及其对学业成绩的影响[J]. 高秀梅.  高教探索. 2020(01)
[2]基于模糊聚类和支持向量回归的成绩预测[J]. 申航杰,琚生根,孙界平.  华东师范大学学报(自然科学版). 2019(05)
[3]学生成绩关键因素挖掘与成绩预测[J]. 谢娟英,张宜,陈恩红.  南京信息工程大学学报(自然科学版). 2019(03)
[4]ARPDF:基于对话流的学习者成绩等级预测算法[J]. 罗达雄,叶俊民,郭霄宇,王志锋,陈曙.  小型微型计算机系统. 2019(02)
[5]大学生大五人格特征与英语学习之间的关系研究[J]. 杨蕴桢,黄芳,赵雯.  台州学院学报. 2018(06)
[6]基于改进的聚类和关联规则挖掘的学生成绩分析[J]. 张甜,尹长川,潘林,安杰.  北京邮电大学学报(社会科学版). 2018(02)
[7]专业兴趣吻合度 大五人格对大学生学习成绩的影响[J]. 李艳.  校园心理. 2018(02)
[8]利用电子签到数据预测课程成绩[J]. 刘俊岭,李婷,孙焕良,于戈.  计算机科学与探索. 2018(06)
[9]面向在线智慧学习的教育数据挖掘技术研究[J]. 刘淇,陈恩红,朱天宇,黄振亚,吴润泽,苏喻,胡国平.  模式识别与人工智能. 2018(01)
[10]基于校园卡消费预测学生挂科情况[J]. 周庆,尹春梅,全文君,张代英.  中国教育技术装备. 2017(24)

博士论文
[1]大数据的教育领域应用之研究[D]. 张燕南.华东师范大学 2016



本文编号:3572218

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3572218.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bd61e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com