不均衡样本的分类优化方法
发布时间:2021-11-05 06:57
随着机器学习、数据挖掘、深度学习等领域的快速发展,人们致力于不断优化各种模型。分类问题作为数据挖掘的主要任务,备受学者关注,传统分类策略大都基于代价不敏感的均衡数据,它们往往注重一个模型的整体精度,而这样的分类器对于非均衡的样本数据并不适用。因此,如何改进分类策略以优化不均衡样本的分类器性能,是一个值得讨论的议题。本文以此为目标展开研究,致力于在保持整体性能的前提下,提升分类器对少数类别的学习能力。当前主要的研究方向主要有两个,其一从样本出发,研究如何在尽量不损失原样本所含信息的前提下平衡类样本数量,同时还应尽量避免噪声的产生;其二从算法出发,通过训练单类样本分类器、引入代价敏感因子、采用集合策略等方式提升学习器分类性能。本文在提出优化策略之前,首先提出一种新型复合评价准则IIBAα,通过理论和实验证明了其不仅能度量模型整体性能,还能够侧重评估少数类别的分类,同时具有更高的稳健性和抗噪声性等优点,可以将其运用于优化效果的比较中。之后本文分为样本和算法策略两方面介绍非均衡样本分类的优化方式,其中样本优化是核心所在。本文提出了一种基于聚类思想的组合样本优化方法框架,这种样本优化方法可与各种...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
平衡后样本散点图
本文编号:3477304
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
平衡后样本散点图
本文编号:3477304
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3477304.html