当前位置:主页 > 教育论文 > 教育体制论文 >

DDTR:大数据背景下的学生就业率预测模型

发布时间:2020-12-16 19:08
  伴随大数据驱动的深入感知及预测方法的飞速发展,分析及研究学生就业率的变化趋势,对调整课程结构、提高学生就业率,均有较好的促进作用。本文基于在校学生的多项课程成绩,利用贪心选择策略,建立了采用自学习模式的就业率预测模型DDTR,通过混淆矩阵各项系数验证,该预测模型具有较高的就业预见性,对学校课程规划及学生就业具有一定的指导意义。 

【文章来源】:中国教育信息化. 2018年21期

【文章页数】:3 页

【部分图文】:

DDTR:大数据背景下的学生就业率预测模型


就业率预测模型功能模块

框架图,就业率,框架


萄е柿亢陀?煅??芰?的指标,对于学校和社会间良性作用的程度具有客观的反映。影响毕业生就业的因素具有多样性,通过对毕业生和招聘单位的调查,学生的学业成绩是就业率一个非常重要的影响因素,本文旨在建立一种基于学生学业成绩的就业率预测模型,通过历史数据的比对,审查和规划学校的发展。同时,通过产生可能就业困难学生名单,学校可对这些学生进行针对性指导,帮助学生就业。基于成绩的就业率预测框架DDTR(datanormalization-dimensionspecifi-cation-decisiontree-employmentrate)是一个自学习系统,如图1所示,每一次预测后,预测报告都要和真实报告进行分析匹配并最终给出反馈意见,进一步修改和完善预测模型。三、DDTR模块分析DDTR中的学生成绩主要来自于课程成绩,基于此,本文将学生的课程成绩作为模型的训练样本。系统的功能模块如图2所示,由3大模块组成,其中决策树模型模块负责将输入的数据根据相应算法进行分析后生成预测文件;原始数据处理模块负责将学生的课程成绩处理成预测模型需要的数据格式;测试与分析模块则负责将预测后的数据进行分析,以便进一步改善预测模型。[1]1.决策树模型决策树[2]是一种由结点和有向边组成的层次结构,DDTR:大数据背景下的学生就业率预测模型席菁(苏州市教育科学研究院,江苏苏州215004)摘要:伴随大数据驱动的深入感知及预测方法的飞速发展,分析及研究学生就业率的变化趋势,对调整课程结构、提高学生就业率,均有较好的促进作用。本文基于在校学生的多项课程成绩,利用贪心选择策略,建立了采用自学习模式的就业率预测模型DDTR,通过混淆矩阵各项系数验证,该预测模型具有较高的就业预见性,对学校课程规划及学生就业具有一定的指导意义。关键词:大数据;就业?

模型图,决策树,模型


将结点中的记录分布到创建好的孩子结点中。模型使用Weka提供的J48决策树工具来实现,其中决策树算法采用的是C4.5的实现。Weka[3]是使用Java编写的开源机器学习工具和数据挖掘软件。作为公开的数据挖掘平台,集合了数据预处理、分类、回归、聚类和关联规则等算法。决策树模型生成过程如下:首先进入explorer功能,使用preprocess选项卡导入转换好格式后的Weka输入文件,转至classify选项卡选择tree分类器下的J48工具,填入自定义的决策树参数。这里使用参数J48-C0.25-M2,点击Start,Weka将训练模型生成决策树模型,如图3所示。其中每一个属性的数据类型都是numeric,对于这种连续的属性,决策树需要找到相应的划分点,将实数轴上的区域进行二分。如图3中的0.54、0.38这些数值,即选取划分点,从而对于连续属性而言,属性测试条件变成了具有二元输出的比较测试。二元划分父结点,产生一棵二叉的决策树。2.原始数据处理根据上文中预测模型需要的输入文件格式,需要对数据进行预处理[4],首先进行数据清洗,剔除缺失数据和无用信息,然后对数据进行归一化处理,利用相似性度量对课程进行归类,将同一类下的课程成绩利用学分进行合并,最终将所有课程划分为13个聚类,聚类内科目成绩关于学分的加权平均作为此聚类的得分。聚类作为分类器的输入属性,聚类得分/表现作为属性下的值并以此作为训练决策树分类器的输入。(1)数据清洗在实际应用中,数据往往不够“干净”,需要通过一系列步骤来对“脏”数据进行清洗,首先填补缺失值,然后确定并删除“噪声”数据,以确保数据质量。如果有些重要的属性由于各种原因导致没有数值,那么在数据清洗时要对这些空缺属性值按照约定进行处理:如果一条记录中多个属性值空缺,或者关键属性值

【参考文献】:
期刊论文
[1]面向大数据分析的决策树算法[J]. 张棪,曹健.  计算机科学. 2016(S1)
[2]网络大数据:现状与展望[J]. 王元卓,靳小龙,程学旗.  计算机学报. 2013(06)
[3]WEKA环境下基于模糊理论的聚类算法[J]. 郑世明,苗壮,宋自林,高志年.  解放军理工大学学报(自然科学版). 2012(01)

硕士论文
[1]基于数据挖掘的数据清洗及其评估模型的研究[D]. 邹杰.北京邮电大学 2017



本文编号:2920637

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyutizhilunwen/2920637.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9d1bd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com