基于欠抽样技术和旋转森林的非平衡类方法研究

发布时间:2023-05-21 23:11
  作为模式识别和机器学习研究领域中最具挑战性和吸引力的问题之一,非平衡类问题引起了越来越广泛的关注,其表现为数据集样本类别分布的高度不平衡。在很多实际问题中,如溢油检测,漏油事件发生的频率较低,但这种事件一旦发生后果比较严重。因此如何有效识别这些感兴趣的少数类样本往往比正确识别多数类样本更加重要。基于欠抽样的组合分类器方法是常用于处理非平衡类问题的有效方法,但该方法使用欠抽样方法获得的数据集往往较小,如何在较少的数据集合上学习具有高准确率的基分类器是该方法成功的核心问题之一。观察到旋转森林比Bagging、Adaboost等方法具有更高的泛化性能,故本文选择旋转森林作为基学习器,以获得高准确率的基分类器。另外旋转森林对数据分布很敏感,相较于支持向量机、神经网络,其更容易学习有差异的基分类器,这是基于欠抽样的组合分类器方法能在非平衡类问题取得成功的另一个原因。因此,本文研究将欠抽样技术与旋转森林方法有效结合起来,提出有效的面向非平衡类问题的高效处理方法。本文的主要工作如下:(1)提出基于欠抽样和旋转森林的组合分类器方法(Ensemble with Undersampling techniq...

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
    1.3 本文主要工作
    1.4 本文组织结构
第2章 相关理论
    2.1 非平衡类问题
    2.2 非平衡类问题解决方法
        2.2.1 数据层方法
        2.2.2 算法层方法
        2.2.3 组合分类器方法
    2.3 评价指标
    2.4 本章小结
第3章 基于欠抽样和旋转森林的组合分类器方法
    3.1 算法动机与算法思想
    3.2 基于欠抽样和旋转森林的组合分类器方法
        3.2.1 EUR-Ⅰ
        3.2.2 EUR-Ⅱ
    3.3 数据集及实验设置
    3.4 实验结果与分析
    3.5 本章小结
第4章 基于欠抽样的旋转森林增强算法
    4.1 动机及算法基本思想
    4.2 基于欠抽样的旋转森林增强算法
    4.3 实验设置
    4.4 实验结果分析
    4.5 本章小结
第5章 总结与展望
    5.1 总结
    5.2 展望
参考文献
攻读学位期间获得与学位论文相关的科研成果目录
致谢



本文编号:3821608

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3821608.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1f4e1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com