基于决策树方法的非平衡问题数值分析与算法改进

发布时间：2021-02-19 19:22

　　非平衡问题在数据科学研究中广泛存在,对于此类问题人们往往较为关心小类被分对的概率。本文旨在研究不同因素对决策树分类效果的影响,以及如何对决策树算法进行改进,提升其在非平衡问题中的表现。通过决策树算法和K-近邻算法的有机结合,本文构造出了一个新的算法—LRDT算法（Leaf Rank Decision Tree）。LRDT算法的核心在于根据合适的指标对决策树中的大类叶子进行排序,通过优先处理表现不好的叶子来提高小类的准确率。该算法缓解了非平衡问题中决策树为了保证整体准确率偏向大类,导致小类被埋没的问题,在提高小类准确率的同时未损失整体的准确率。

【文章来源】：厦门大学福建省 211工程院校 985工程院校教育部直属院校

【文章页数】：48 页

【学位级别】：硕士

【文章目录】：
中文摘要
英文摘要
第一章引言
    1.1 研究背景
    1.2 本文主要工作
第二章决策树
    2.1 C4.5算法
    2.2 实例应用
第三章不同因素对决策树分类效果的影响及数值分析
    3.1 评价指标
    3.2 单个因素对决策树分类效果的影响
    3.3 多个因素共同作用的影响
第四章 LRDT算法
    4.1 基本思想
    4.2 算法介绍
第五章实验
    5.1 数据介绍
    5.2 实验结果
第六章结论
参考文献
致谢

本文编号：3041572

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3041572.html

上一篇：RoboCup机器人救援仿真中多智能体协作模型的研究与建立
下一篇：改进的类别不平衡学习算法及其分布式研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|