不平衡数据分类方法研究及其应用

发布时间:2021-07-02 07:06
  不平衡学习指在分类任务中不同类别的训练样本数目差别很大的情况。近十年来,这个领域越发的受到研究者的关注,近五年以来,更是呈现爆发式的增长。与传统分类任务不同,一方面数据的不平衡性会导致传统分类算法的性能大幅下降,另一方面,不平衡学习往往存在错分代价不均等的问题,故对不平衡学习的研究有重要的意义。之前的研究已经提出了大量的不平衡学习算法,但对于从后处理预测概率的角度提升少类的分类精度却鲜有研究。基于当前的研究,针对二分类和多分类问题,对不平衡学习中,少数类样本精度不高问题以及错分代价不均衡问题进行改进。本文主要通过两阶段的学习过程,对不平衡数据分类进行优化。第一阶段得到预测概率,第二阶段利用改进的花朵授粉算法对预测概率的进行优化,保证得到更好的分类结果。实验表明,在10个二分类真实数据集上,此方法能成功的提升少数类样本的精确度,具有很好的实际运用价值,在多分类中,通过人工数据集和真实数据集的验证,此方法都在少数类样本上取得了更高的精确度,并把此方法成功的应用在农场退出预测问题上,实验表明,该策略大幅度的提升了预测精度。 

【文章来源】:重庆邮电大学重庆市

【文章页数】:70 页

【学位级别】:硕士

【部分图文】:

不平衡数据分类方法研究及其应用


不平衡数据集的概率密度分布及分类边界

不平衡数据分类方法研究及其应用


不同不平

不平衡数据分类方法研究及其应用


不同样

【参考文献】:
期刊论文
[1]基于分类精度和相关性的随机森林算法改进[J]. 王日升,谢红薇,安建成.  科学技术与工程. 2017(20)
[2]求解旅行商问题的离散花授粉算法[J]. 李前,贺兴时,杨新社.  计算机与现代化. 2016(07)

博士论文
[1]基于蒙特卡洛神经网络算法的不平衡数据分类研究[D]. 冯芳.兰州大学 2019

硕士论文
[1]基于极限学习机的多标记不平衡分类算法研究[D]. 许二戗.江苏科技大学 2019



本文编号:3259999

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3259999.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7f72f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com