当前位置:主页 > 管理论文 > 统计学论文 >

基于Logistic算法与数据采样的不平衡分类数据的研究

发布时间:2022-10-15 20:34
  随着经济及科技的发展,当今处于信息爆炸的时代,大数据处处存在,其中分类数据尤为常见。在分类数据中,以往的方法大都关注平衡数据的分类问题,其中有线性判别分析、二次判别分析、支持向量机、Logistic模型及boosting等。这些分类方法都是基于不同类别样本数平衡的前提假设下进行训练学习,对于不平衡分类,其整体的较高预测准确度往往归功于多数类的精度,而忽略了少数类的分类精确度。因此,传统的分类方法不能直接应用来处理不平衡数据。本文针对不平衡二分类问题,基于Logistic模型,从算法和数据采样两个层面来提出改进的Logistic分类方法,以此来达到提高少数类分类准确率的目的。普通Logistic分类通常选择α=0.5作为阈值,为了处理不平衡数据,本文提出对阀值α进行自适应的选择以达到提升少数类分类准确率的目的。数据采样层面的想法是对多数类进行分层采样,再应用Logistic方法、随机森林、支持向量机、神经网络等机器学习方法对生成新的近似平衡的子集数据进行分类。最后,应用本文所建议的方法来分析信用卡违约数据,实际数据结果证实本文所提的方法能够有效的提高不平衡数据的分类性能。 

【文章页数】:45 页

【学位级别】:硕士

【部分图文】:

基于Logistic算法与数据采样的不平衡分类数据的研究


SVM高维线性不可分

基于Logistic算法与数据采样的不平衡分类数据的研究


旋转映射后的线性可分

基于Logistic算法与数据采样的不平衡分类数据的研究


平面二分类情形

【参考文献】:
期刊论文
[1]面向类不平衡的逻辑回归方法[J]. 郭华平,董亚东,邬长安,范明.  模式识别与人工智能. 2015(08)
[2]加权最大夹角间隔核心集向量机的不平衡数据分类[J]. 鲁淑霞,李黎敏.  山东大学学报(工学版). 2014(03)
[3]改进随机子空间与决策树相结合的不平衡数据分类方法[J]. 胡小生.  佛山科学技术学院学报(自然科学版). 2013(05)
[4]聚类边界过采样不平衡数据分类方法[J]. 楼晓俊,孙雨轩,刘海涛.  浙江大学学报(工学版). 2013(06)
[5]集成降采样不平衡数据分类方法研究[J]. 郭丽娟,倪子伟,江弋,邹权.  计算机科学与探索. 2013(07)
[6]不平衡数据的无监督特征选择方法[J]. 蒋盛益,王连喜.  小型微型计算机系统. 2013(01)
[7]基于Boosting的不平衡数据分类算法研究[J]. 李秋洁,茅耀斌,王执铨.  计算机科学. 2011(12)
[8]改进的SVM解决背景知识数据中的类不平衡[J]. 王伟,薛安荣,刘峰.  计算机应用研究. 2011(08)
[9]不平衡类数据挖掘研究综述[J]. 翟云,杨炳儒,曲武.  计算机科学. 2010(10)
[10]基于支持向量机的不平衡数据分类算法的研究[J]. 刘海涛,黄敏,朱启兵,王聪.  计算机应用研究. 2009(08)

硕士论文
[1]综合过采样和欠采样的不平衡数据集的学习研究[D]. 闫欣.东北电力大学 2016
[2]面向不平衡分类的逻辑回归算法[D]. 董亚东.郑州大学 2015
[3]基于集成学习的不平衡数据分类[D]. 宋海燕.西安电子科技大学 2014
[4]基于非平衡数据分类的贷款违约预测研究[D]. 周丽峰.中南大学 2013
[5]基于组合抽样技术的集成学习算法研究与应用[D]. 刘国强.中国海洋大学 2011
[6]不平衡数据集分类的Random-SMOTE方法研究[D]. 董燕杰.大连理工大学 2009



本文编号:3691995

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3691995.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5a23b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com