基于数据挖掘的高校学生成绩关联分析研究
发布时间:2020-03-19 18:56
【摘要】:随着我国教育的飞速发展,高等教育已经逐渐普遍化,大学生数量日益增长。然而学生在校期间的表现参差不齐,每年都有部分学生出现不及格、留级、退学等现象。为提高学生的学习质量、降低教学管理的难度,本文借助数据挖掘手段对学生在校期间的成绩数据进行分析,寻找影响学生成绩的因素。挖掘结果能够为学生提供有针对性的指导,并为教学方法的调整和改进提供有效的信息。本文利用本校09-11级通信工程专业学生的成绩数据,针对成绩数据离散化和关联规则挖掘这两个目标,深入的学习和研究了聚类算法和关联规则挖掘算法,在传统算法的基础上完成了改进,并应用改进后的算法进行了多角度的成绩关联分析。主要研究内容如下:1.用于成绩数据离散化的聚类算法的改进研究。本文根据成绩数据的分布特点和离散化要求,论述了现有离散化方法的缺点和不适用性。然后提出了基于样本分布密度的初始聚类中心优化和离群点预处理K-Means算法,给出了样本密度、初始聚类中心域等参量的计算方法,并利用Calinski-Harabasz指数、轮廓系数等参数衡量了该算法与现有离散化方法的性能。2.引入兴趣度的关联规则挖掘算法研究。由于原始的关联规则挖掘算法不能判断规则的有趣性,本文研究了几种常见的兴趣度度量,采用了一种引入Conf(X(?)Y)修正的基于差异的兴趣度度量。引入该兴趣度度量的关联规则挖掘算法能够对规则的有效性和价值进行判断。3.课程维度和学生维度的成绩关联分析。课程维度的关联分析通过改进的聚类算法和改进的关联规则挖掘算法在真实成绩数据中的应用,验证了算法的有效性,并以挖掘结果为依据分析了课程之间的关联。学生维度的关联分析利用了频繁模式挖掘、改进的关联规则挖掘、统计分析等方法,从多个角度讨论了影响学生成绩的因素。
【图文】:
群[24]%。聚类算法能够识别空间中的点所形成的结构特征,,因此在探索性的模式逡逑分析、分组、决策等情景下具有很好的应用效果[24]265,常被应用于信息检索、图逡逑像分割、语音识别和数据压缩等研究方向。图2-1展示了聚类算法对数据集的识逡逑别和划分。逡逑^逦Clustering逡逑yc邋?逡逑:.5邋.逦?"????*??逡逑2.0逦?邋?邋??“逡逑I邋呭逡逑.逦?逦??邋■S肧肧茫甋缅义希埃板义希埃靛危蝈义希插危板危插危村危跺澹跺澹保板危保插义贤迹玻本劾嗨惴ㄥ义隙杂诰劾嗨惴ǖ难绣臣河屑甘甑睦贰T缭冢保梗罚茨辏牛觯澹颍椋簦艟透隽司坼义侠嗨惴ㄖ小按亍钡暮澹和桓龃刂械氖堤迨窍嗨频模煌拇刂械氖堤迨遣幌噱义纤频模灰桓龃厥蔷劾嗫占渲腥舾傻愕募希⑶乙桓龃刂腥我饬降慵涞木嗬胍欢ㄥ义闲∮诓煌刂械娜我饬降慵涞木嗬耄灰桓龃乜梢员恍稳菸桓龆辔占淠诘牧ㄥ义锨颍渲械牡憔哂邢喽越细叩拿芏龋肫渌淖灞灰桓霭喽缘兔芏鹊愕腻义锨蛩指艨郏保保荨>劾嗨惴ň褪歉菔莸愕木嗬搿⒚芏然蛳嗨菩越荻韵蠡义希峰义
本文编号:2590579
【图文】:
群[24]%。聚类算法能够识别空间中的点所形成的结构特征,,因此在探索性的模式逡逑分析、分组、决策等情景下具有很好的应用效果[24]265,常被应用于信息检索、图逡逑像分割、语音识别和数据压缩等研究方向。图2-1展示了聚类算法对数据集的识逡逑别和划分。逡逑^逦Clustering逡逑yc邋?逡逑:.5邋.逦?"????*??逡逑2.0逦?邋?邋??“逡逑I邋呭逡逑.逦?逦??邋■S肧肧茫甋缅义希埃板义希埃靛危蝈义希插危板危插危村危跺澹跺澹保板危保插义贤迹玻本劾嗨惴ㄥ义隙杂诰劾嗨惴ǖ难绣臣河屑甘甑睦贰T缭冢保梗罚茨辏牛觯澹颍椋簦艟透隽司坼义侠嗨惴ㄖ小按亍钡暮澹和桓龃刂械氖堤迨窍嗨频模煌拇刂械氖堤迨遣幌噱义纤频模灰桓龃厥蔷劾嗫占渲腥舾傻愕募希⑶乙桓龃刂腥我饬降慵涞木嗬胍欢ㄥ义闲∮诓煌刂械娜我饬降慵涞木嗬耄灰桓龃乜梢员恍稳菸桓龆辔占淠诘牧ㄥ义锨颍渲械牡憔哂邢喽越细叩拿芏龋肫渌淖灞灰桓霭喽缘兔芏鹊愕腻义锨蛩指艨郏保保荨>劾嗨惴ň褪歉菔莸愕木嗬搿⒚芏然蛳嗨菩越荻韵蠡义希峰义
本文编号:2590579
本文链接:https://www.wllwen.com/jiaoyulunwen/gaodengjiaoyulunwen/2590579.html