当前位置:主页 > 科技论文 > 自动化论文 >

基于改进随机森林算法的研究与应用

发布时间:2023-03-19 15:02
  在高校教学管理工作中,学校教学质量优劣重要评估指标之一是学生课程成绩,存在多种因素影响学生课程成绩。利用数据挖掘工具对学生的学习课程成绩进行预测分析,进而利用预测分析结果及时指正学生出现的不良学习行为,同时检查老师的教学效果,这具有非常重要的研究意义。为了完成学生课程成绩预测工作,本文首先对于传统随机森林算法的研究现状进行分析,并结合模拟退火算法提出在特征选择、参数优化以及权重设定方向进行优化的改进随机森林算法IRFC(Improved Random Forest Classifier)。改进的随机森林算法对于相关参数(特征个数、树规模、树决策权重)进行二进制编码作为算法优化的目标变量,并以袋外误差(Out of Bag,OOB)作为优化目标函数,全面优化算法分类性能。在进行改进随机森林算法的验证过程中,作者采集多年历史学生行为记录以及学科成绩(三年数据)构造学生成绩数据集,从而根据学生行为信息进行学生成绩(两类:合格与不合格)预测的工作。目前已经完成改进随机森林算法在此数据集以及心脏病数据集两个数据集上的仿真验证工作,实验结果证明本文提出改进随机森林算法具有更高的泛化能力、较小的OO...

【文章页数】:62 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景
    1.2 研究现状
        1.2.1 教育数据挖掘
        1.2.2 数据挖掘算法
    1.3 研究目标与方向
        1.3.1 关键技术路线
        1.3.2 本文主要工作
    1.4 论文结构安排
第2章 相关背景及技术
    2.1 理论介绍
        2.1.1 分类算法
        2.1.2 决策树算法
        2.1.3 随机森林算法
        2.1.4 模拟退火算法
    2.2 分类算法评价指标
    2.3 数据平台技术
        2.3.1 R语言
        2.3.2 PostgreSQL数据库
    2.4 本章小结
第3章 改进算法介绍
    3.1 传统随机森林算法
        3.1.1 Bagging方法
        3.1.2 CART算法
        3.1.3 随机森林算法流程
    3.2 改进算法
        3.2.1 改进思路
        3.2.2 改进算法流程
    3.3 本章小结
第4章 UCI数据集上的算法评估
    4.1 UCI数据集
    4.2 算法基础评估
    4.3 本章小结
第5章 算法在学生课程成绩预测上的应用
    5.1 学生成绩数据集说明
        5.1.1 特征规范化
        5.1.2 传统算法结果对比
    5.2 平台环境
    5.3 算法评估
        5.3.1 算法基础评估
        5.3.2 最优参数决策时长分析
        5.3.3 特征选择结果分析
        5.3.4 OOB误差分析
        5.3.5 算法并行化对比
    5.4 本章小结
第6章 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢
个人简历及在学期间发表的学术论文与研究成果



本文编号:3765459

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3765459.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户34df2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com