基于旋转森林和LightGBM分类算法的高校实践教学数据分析
发布时间:2022-08-11 09:36
本科实践教学是提高大学生人才培养质量的关键环节。近年来,国内各大高校都在全力发展对于本科生的实践教学建设。在此大环境下,吉林大学构建了符合本校校情的本科实践教学体系,并于2013年开始正式启动实践教学信息化平台建设工作。经过多年实际运行,实践教学管理平台已收集到学生在实践教学中的大量真实数据。对于这类教育领域大数据中潜在的信息,大量的研究者开始对其进行数据挖掘研究工作。通常在教育数据的研究中,主要使用的方法包括分类、聚类和关联规则挖掘等数据挖掘方法。在本文中使用了新的分类模型对实践教学管理数据集进行了数据挖掘研究。分类算法的种类有多种,但由于实际应用问题的复杂性和多样性,目前使用最为广泛的分类算法是由多个单一分类器结合而成的集成分类模型。近年来,在机器学习竞赛分类问题领域的佼佼者就是由微软开发的LightGBM算法。并且由于旋转森林算法在中小型数据集分类问题中表现优秀,本文提出了一种基于旋转森林和LightGBM的集成分类模型ROF-LGB模型,力图对实践教学管理数据集的潜在信息进行更深的挖掘。本文中使用ROF-LGB模型与其他多种树形分类模型在不同公共数据集中进行了大量对比实验,实验...
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 课题背景及研究意义
1.2 分类算法研究现状
1.3 教育数据挖掘研究现状
1.4 论文主要内容及结构
第2章 相关知识与理论
2.1 随机森林算法
2.2 旋转森林算法
2.2.1 PCA主成分分析
2.2.2 旋转森林模型
2.3 LightGBM算法
2.3.1 Boosting算法与GBDT算法
2.3.2 XGBoost算法
2.3.3 LightGBM算法
第3章 结合旋转森林和LightGBM的组合分类器
3.1 模型构建
3.2 与其他算法模型对比实验
3.2.1 分类模型性能评价指标
3.2.2 公共数据集实验描述
3.2.3 公共数据集实验结果分析
3.2.4 实践教学管理数据集准确率对比
3.2.5 实践教学管理数据集微平均值ROC曲线对比
第4章 实践教学管理数据分析研究
4.1 模型对现实的指导意义
4.2 实践教学管理数据集特征与标签结构分析
4.3 不同规模数据集实验
4.3.1 不同特征实验
4.3.2 不同特征实验结果分析
4.3.3 不同标签实验
4.3.4 不同标签实验结果分析
4.4 实验结论
第5章 总结与展望
5.1 本文总结
5.2 本文研究的局限性与展望
参考文献
作者简介
致谢
【参考文献】:
期刊论文
[1]基于消息队列的LightGBM超参数优化[J]. 南东亮,王维庆,王海云. 计算机工程与科学. 2019(08)
[2]基于实践能力培养的本科实践教学信息化建设探究[J]. 王守佳,胡亮,高淑贞,郭东伟,赵军,付坤,曲明. 创新创业理论研究与实践. 2019(14)
[3]基于LightGBM的网络入侵检测系统[J]. 莫坤,王娜,李恒吉,李朝阳,李剑. 信息安全研究. 2019(02)
[4]我国教育大数据的研究现状、问题与对策——基于CNKI学术期刊的内容分析[J]. 李振,周东岱,董晓晓,黄雪娇. 现代远距离教育. 2019(01)
[5]基于LightGBM算法的P2P项目信用评级模型的设计及应用[J]. 马晓君,沙靖岚,牛雪琪. 数量经济技术经济研究. 2018(05)
[6]数据挖掘中的分类算法综述[J]. 魏茂胜. 网络安全技术与应用. 2017(06)
[7]教育数据挖掘:大数据时代的教育变革[J]. 陈雯雯,夏一超. 中国教育信息化. 2017(07)
[8]edX平台教育大数据的学习行为分析与预测[J]. 贺超凯,吴蒙. 中国远程教育. 2016(06)
[9]面向基因数据分类的旋转森林算法研究[J]. 刘亚卿,陆慧娟,杜帮俊,余翠. 中国计量学院学报. 2015(02)
[10]基于大数据技术的高校实践教学研究[J]. 江雨燕,李常训,赵文辉,吴超. 学理论. 2015(03)
博士论文
[1]大数据的教育领域应用之研究[D]. 张燕南.华东师范大学 2016
硕士论文
[1]面向工程认证的实践教学管理及数据挖掘[D]. 王超将.吉林大学 2019
[2]数据挖掘在实践教学信息网中的研究与应用[D]. 黄佳彬.北方工业大学 2014
[3]面向创新创业能力培养的高校实践教学体系研究[D]. 欧阳泓杰.华中师范大学 2014
[4]决策树算法在高校研究生就业信息库中的应用研究[D]. 王琴.武汉理工大学 2010
[5]学生信息管理与数据挖掘的应用[D]. 马冰冰.山东大学 2008
本文编号:3674418
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 课题背景及研究意义
1.2 分类算法研究现状
1.3 教育数据挖掘研究现状
1.4 论文主要内容及结构
第2章 相关知识与理论
2.1 随机森林算法
2.2 旋转森林算法
2.2.1 PCA主成分分析
2.2.2 旋转森林模型
2.3 LightGBM算法
2.3.1 Boosting算法与GBDT算法
2.3.2 XGBoost算法
2.3.3 LightGBM算法
第3章 结合旋转森林和LightGBM的组合分类器
3.1 模型构建
3.2 与其他算法模型对比实验
3.2.1 分类模型性能评价指标
3.2.2 公共数据集实验描述
3.2.3 公共数据集实验结果分析
3.2.4 实践教学管理数据集准确率对比
3.2.5 实践教学管理数据集微平均值ROC曲线对比
第4章 实践教学管理数据分析研究
4.1 模型对现实的指导意义
4.2 实践教学管理数据集特征与标签结构分析
4.3 不同规模数据集实验
4.3.1 不同特征实验
4.3.2 不同特征实验结果分析
4.3.3 不同标签实验
4.3.4 不同标签实验结果分析
4.4 实验结论
第5章 总结与展望
5.1 本文总结
5.2 本文研究的局限性与展望
参考文献
作者简介
致谢
【参考文献】:
期刊论文
[1]基于消息队列的LightGBM超参数优化[J]. 南东亮,王维庆,王海云. 计算机工程与科学. 2019(08)
[2]基于实践能力培养的本科实践教学信息化建设探究[J]. 王守佳,胡亮,高淑贞,郭东伟,赵军,付坤,曲明. 创新创业理论研究与实践. 2019(14)
[3]基于LightGBM的网络入侵检测系统[J]. 莫坤,王娜,李恒吉,李朝阳,李剑. 信息安全研究. 2019(02)
[4]我国教育大数据的研究现状、问题与对策——基于CNKI学术期刊的内容分析[J]. 李振,周东岱,董晓晓,黄雪娇. 现代远距离教育. 2019(01)
[5]基于LightGBM算法的P2P项目信用评级模型的设计及应用[J]. 马晓君,沙靖岚,牛雪琪. 数量经济技术经济研究. 2018(05)
[6]数据挖掘中的分类算法综述[J]. 魏茂胜. 网络安全技术与应用. 2017(06)
[7]教育数据挖掘:大数据时代的教育变革[J]. 陈雯雯,夏一超. 中国教育信息化. 2017(07)
[8]edX平台教育大数据的学习行为分析与预测[J]. 贺超凯,吴蒙. 中国远程教育. 2016(06)
[9]面向基因数据分类的旋转森林算法研究[J]. 刘亚卿,陆慧娟,杜帮俊,余翠. 中国计量学院学报. 2015(02)
[10]基于大数据技术的高校实践教学研究[J]. 江雨燕,李常训,赵文辉,吴超. 学理论. 2015(03)
博士论文
[1]大数据的教育领域应用之研究[D]. 张燕南.华东师范大学 2016
硕士论文
[1]面向工程认证的实践教学管理及数据挖掘[D]. 王超将.吉林大学 2019
[2]数据挖掘在实践教学信息网中的研究与应用[D]. 黄佳彬.北方工业大学 2014
[3]面向创新创业能力培养的高校实践教学体系研究[D]. 欧阳泓杰.华中师范大学 2014
[4]决策树算法在高校研究生就业信息库中的应用研究[D]. 王琴.武汉理工大学 2010
[5]学生信息管理与数据挖掘的应用[D]. 马冰冰.山东大学 2008
本文编号:3674418
本文链接:https://www.wllwen.com/jiaoyulunwen/gaodengjiaoyulunwen/3674418.html