基于决策树方法的非平衡问题数值分析与算法改进
发布时间:2021-02-19 19:22
非平衡问题在数据科学研究中广泛存在,对于此类问题人们往往较为关心小类被分对的概率。本文旨在研究不同因素对决策树分类效果的影响,以及如何对决策树算法进行改进,提升其在非平衡问题中的表现。通过决策树算法和K-近邻算法的有机结合,本文构造出了一个新的算法—LRDT算法(Leaf Rank Decision Tree)。LRDT算法的核心在于根据合适的指标对决策树中的大类叶子进行排序,通过优先处理表现不好的叶子来提高小类的准确率。该算法缓解了非平衡问题中决策树为了保证整体准确率偏向大类,导致小类被埋没的问题,在提高小类准确率的同时未损失整体的准确率。
【文章来源】:厦门大学福建省 211工程院校 985工程院校 教育部直属院校
【文章页数】:48 页
【学位级别】:硕士
【文章目录】:
中文摘要
英文摘要
第一章 引言
1.1 研究背景
1.2 本文主要工作
第二章 决策树
2.1 C4.5算法
2.2 实例应用
第三章 不同因素对决策树分类效果的影响及数值分析
3.1 评价指标
3.2 单个因素对决策树分类效果的影响
3.3 多个因素共同作用的影响
第四章 LRDT算法
4.1 基本思想
4.2 算法介绍
第五章 实验
5.1 数据介绍
5.2 实验结果
第六章 结论
参考文献
致谢
本文编号:3041572
【文章来源】:厦门大学福建省 211工程院校 985工程院校 教育部直属院校
【文章页数】:48 页
【学位级别】:硕士
【文章目录】:
中文摘要
英文摘要
第一章 引言
1.1 研究背景
1.2 本文主要工作
第二章 决策树
2.1 C4.5算法
2.2 实例应用
第三章 不同因素对决策树分类效果的影响及数值分析
3.1 评价指标
3.2 单个因素对决策树分类效果的影响
3.3 多个因素共同作用的影响
第四章 LRDT算法
4.1 基本思想
4.2 算法介绍
第五章 实验
5.1 数据介绍
5.2 实验结果
第六章 结论
参考文献
致谢
本文编号:3041572
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3041572.html