基于Logistic回归的高校贫困生综合评价研究
发布时间:2021-08-26 19:15
根据调查显示,我国普通高等学校中贫困生的数量还相对较多,因此如何资助贫困生已成为非常重要的问题,而贫困生的评定则是高校贫困生资助的前提和难点所在。目前许多高校所采用的人工评定贫困生的方法存在着主观依据多、客观依据少等缺点,而如今利用大数据挖掘技术对贫困生的评判已是大数据技术在校园中的一项重要应用。本课题以我校真实的校园一卡通消费数据为例进行分析,完成从数据的预处理、数据导入、算法设计、模型建立到贫困生挖掘算法实现的整个过程。首先利用腾讯云服务器搭建大数据分析平台,将校园一卡通数据经过预处理,利用Sqoop工具导入至大数据分析平台并存储在HDFS中,基于SparkMLlib机器学习库进行数据挖掘,将挖掘结果展现出来。本文首先利用机器学习库中的Logistic回归算法进行训练,然后将SVM算法引入到传统的Logistic回归模型中,利用新的集成判别分析规则对贫困生进行挖掘。通过计算学生的食堂消费金额,超市消费比例,校园网网费等变量,从而组成特征向量,依据这些特征向量构成数据集,对贫困生进行挖掘。通过实验建立模型,最后对新的消费数据预测该数据对应的学生是否为贫困生,并对结果进行说明和分析。
【文章来源】:西安科技大学陕西省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图3.2个人消费信息表字段
图 3.3 卡户信息表字段我校学生用户的刷卡消费在以下几个地方比较集中,食堂、超市、校园网账号的交费等。由于七月份与八月份是学校的暑假时间,其消费数据不全且很少,而且具有不确定性,也不能正确的反应学生在校的基本情况,所以将七月份与八月份的消费数据删除,剩下的是 3 月 1 日到 6 月 30 日和 9 月 1 日到 12 月 31 日这八个月的消费数据,总的数据量超过一千万条,数据容量超过 3G。每条数据包含了校园统一身份认证号、卡号、交易日期、交易时间、交易金额、交易余额等多个变量。这些数据是繁杂的,而且数据存在不规范等问题,因此在进行数据挖掘之前需要进行必要的数据预处理,如将不需要的数据予以剔除,对缺失的数据填补,如果没有进行数据预处理,在挖掘的过程中不仅会做许多不必要的工作量,还会影响模型建立过程的执行效率,更有甚者会影响到模型的效率与准确率。本文研究的是贫困生认定辅助依据,拟用学生的校园一卡通消费流水数据作为标准,所以需要保留学生的消费流水,如食堂消费、超市消费、网费等,以及能作为身份识别的数据字段,如校园统一身份认证号等。学生身份数据表有校园统一身份认证号、卡号、卡片状态等多个字段。本文只选取其中需要的部分变量做描述和分析,其余的无关变量
图 3.4 学生基本信息表字段为了使算法具有更好的泛化作用,对男生与女生的消费情况依照用户性别信息理,如图 3.5 为学生基本信息表中的部分数据,表中的 M 代表男生,F 代表
【参考文献】:
期刊论文
[1]基于校园一卡通数据的贫困学生消费异常数据检测分析[J]. 蒲飞,赵正辉,涂旭东,陈苗. 电子测试. 2018(06)
[2]大数据下高校智能资助的技术方案与实施模式研究[J]. 胡培培. 无锡职业技术学院学报. 2018(01)
[3]大数据背景下高校精准资助模式分析[J]. 朱平. 佳木斯职业学院学报. 2017(11)
[4]基于高校学生消费数据的贫困生评价分析[J]. 谭浩,田爱奎,郑睿. 电脑知识与技术. 2017(21)
[5]高校贫困学生辅助评价的研究[J]. 林志兴. 计算机系统应用. 2017(06)
[6]基于大数据的数据挖掘技术与应用[J]. 张爱国. 现代工业经济和信息化. 2017(03)
[7]论数据挖掘技术在贫困生认定与管理中的应用[J]. 龙媛. 知音励志. 2017(01)
[8]数据挖掘在高校贫困生评价中的应用[J]. 杨知玲. 软件导刊. 2016(06)
[9]基于数据挖掘的贫困生认定辅助系统的研究[J]. 刘海苑. 电脑知识与技术. 2015(24)
[10]基于数据挖掘的贫困生认定辅助系统设计[J]. 樊搏,姜玉国. 软件导刊. 2015(12)
硕士论文
[1]大数据背景下高校贫困生资助工作精准化研究[D]. 李成飞.南京邮电大学 2017
[2]数据挖掘技术在校园一卡通系统中的应用研究[D]. 白萍.兰州理工大学 2017
[3]基于Hadoop的校园卡数据挖掘的研究与实现[D]. 戴海辉.南昌航空大学 2017
[4]基于数据挖掘的贫困助学金认定方法研究[D]. 李明君.华中师范大学 2017
[5]数据挖掘技术在高职院校贫困生认定中的应用[D]. 郑丹.安徽大学 2016
[6]基于关联规则的决策树改进算法在贫困生认定中的应用[D]. 董丽娟.郑州大学 2016
[7]数据挖掘在校园卡消费中的研究与应用[D]. 张红蕾.兰州交通大学 2016
[8]数据挖掘在高校贫困生评价中的应用研究[D]. 杨知玲.华南理工大学 2015
[9]校园一卡通数据分析平台研究与设计[D]. 刘灵松.山东师范大学 2015
[10]基于数据挖掘的高校贫困生认定系统设计和分析[D]. 张建明.东南大学 2015
本文编号:3364812
【文章来源】:西安科技大学陕西省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图3.2个人消费信息表字段
图 3.3 卡户信息表字段我校学生用户的刷卡消费在以下几个地方比较集中,食堂、超市、校园网账号的交费等。由于七月份与八月份是学校的暑假时间,其消费数据不全且很少,而且具有不确定性,也不能正确的反应学生在校的基本情况,所以将七月份与八月份的消费数据删除,剩下的是 3 月 1 日到 6 月 30 日和 9 月 1 日到 12 月 31 日这八个月的消费数据,总的数据量超过一千万条,数据容量超过 3G。每条数据包含了校园统一身份认证号、卡号、交易日期、交易时间、交易金额、交易余额等多个变量。这些数据是繁杂的,而且数据存在不规范等问题,因此在进行数据挖掘之前需要进行必要的数据预处理,如将不需要的数据予以剔除,对缺失的数据填补,如果没有进行数据预处理,在挖掘的过程中不仅会做许多不必要的工作量,还会影响模型建立过程的执行效率,更有甚者会影响到模型的效率与准确率。本文研究的是贫困生认定辅助依据,拟用学生的校园一卡通消费流水数据作为标准,所以需要保留学生的消费流水,如食堂消费、超市消费、网费等,以及能作为身份识别的数据字段,如校园统一身份认证号等。学生身份数据表有校园统一身份认证号、卡号、卡片状态等多个字段。本文只选取其中需要的部分变量做描述和分析,其余的无关变量
图 3.4 学生基本信息表字段为了使算法具有更好的泛化作用,对男生与女生的消费情况依照用户性别信息理,如图 3.5 为学生基本信息表中的部分数据,表中的 M 代表男生,F 代表
【参考文献】:
期刊论文
[1]基于校园一卡通数据的贫困学生消费异常数据检测分析[J]. 蒲飞,赵正辉,涂旭东,陈苗. 电子测试. 2018(06)
[2]大数据下高校智能资助的技术方案与实施模式研究[J]. 胡培培. 无锡职业技术学院学报. 2018(01)
[3]大数据背景下高校精准资助模式分析[J]. 朱平. 佳木斯职业学院学报. 2017(11)
[4]基于高校学生消费数据的贫困生评价分析[J]. 谭浩,田爱奎,郑睿. 电脑知识与技术. 2017(21)
[5]高校贫困学生辅助评价的研究[J]. 林志兴. 计算机系统应用. 2017(06)
[6]基于大数据的数据挖掘技术与应用[J]. 张爱国. 现代工业经济和信息化. 2017(03)
[7]论数据挖掘技术在贫困生认定与管理中的应用[J]. 龙媛. 知音励志. 2017(01)
[8]数据挖掘在高校贫困生评价中的应用[J]. 杨知玲. 软件导刊. 2016(06)
[9]基于数据挖掘的贫困生认定辅助系统的研究[J]. 刘海苑. 电脑知识与技术. 2015(24)
[10]基于数据挖掘的贫困生认定辅助系统设计[J]. 樊搏,姜玉国. 软件导刊. 2015(12)
硕士论文
[1]大数据背景下高校贫困生资助工作精准化研究[D]. 李成飞.南京邮电大学 2017
[2]数据挖掘技术在校园一卡通系统中的应用研究[D]. 白萍.兰州理工大学 2017
[3]基于Hadoop的校园卡数据挖掘的研究与实现[D]. 戴海辉.南昌航空大学 2017
[4]基于数据挖掘的贫困助学金认定方法研究[D]. 李明君.华中师范大学 2017
[5]数据挖掘技术在高职院校贫困生认定中的应用[D]. 郑丹.安徽大学 2016
[6]基于关联规则的决策树改进算法在贫困生认定中的应用[D]. 董丽娟.郑州大学 2016
[7]数据挖掘在校园卡消费中的研究与应用[D]. 张红蕾.兰州交通大学 2016
[8]数据挖掘在高校贫困生评价中的应用研究[D]. 杨知玲.华南理工大学 2015
[9]校园一卡通数据分析平台研究与设计[D]. 刘灵松.山东师范大学 2015
[10]基于数据挖掘的高校贫困生认定系统设计和分析[D]. 张建明.东南大学 2015
本文编号:3364812
本文链接:https://www.wllwen.com/jiaoyulunwen/gaodengjiaoyulunwen/3364812.html