当前位置:主页 > 科技论文 > 数学论文 >

基于SMOTEBoosting和多种分类算法的不平衡数据分类问题改进情况的对照分析

发布时间:2020-06-29 07:54
【摘要】:伴随着数据收集技术和互联网科技的不断进步,欺诈交易检测、网络入侵检测、web挖掘、直接营销和医学诊断等领域显现出越来越多的不平衡数据分类问题亟待解决。在本文中,我们着重关注不同分类算法对不平衡数据分类问题的改进情况。针对不平衡数据,在总结以往给训练样本分配不同权重和对原始数据重复采样的两种传统方法的基础上,引入2002年Chawla等人提出的模拟少数样本过抽样算法(SMOTE)及2009年Shengguo Hu等人针对SMOTE提出的改进形式(MSMOTE),以此来对数据类别的平衡性进行预处理;其次选取代表性的分类算法引入Boosting循环,通过增加错分样本再次被抽取的权重的方式来提高少数类样本分类的准确度,并将SMOTEBoosting模型应用于财务预警领域。文中涉及的分类算法从经典的Logistic回归、线性判别分析等传统统计模型延伸到机器学习领域的决策树、K近邻以及近些年新兴的并且备受各界关注的支持向量机和神经网络等算法模型。在模型的对比和评价方面,由于不平衡数据集中多数类数据的数量明显高于少数类,即使分类器把全部样本都标记为多数类也会实现很高的精度,因而使用通常的预测精度这一评价指标并不合适。本文引入针对少数类分类的评价指标:精确率、召回率、F得分以及ROC曲线和AUC数值,对不同分类模型针对不同数据集的分类表现情况进行多角度的对照分析。
【学位授予单位】:厦门大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:O212.1;TP181
【图文】:

线性判别分析,实验结果,对照分析,分类问题


es2:Pinla教据荃于线性判别分析的翎OTE和公洲OTE实验结果

实验结果,线性判别分析,对照分析,分类问题


逦基于SMOTEBoosting和多种分类算法的不平衡数据分类问题改进情况的对照分析逦逡逑图4-2-7:邋pima数据基于线性判别分析的SMOTEBoosting和MSMOTEBoosting实验结果逡逑LDA-SMOTEBoosting邋of邋pima逦LDA-MSMOTEBoosting邋of邋pima逡逑

【参考文献】

相关期刊论文 前2条

1 郑淑娟;刘遵雄;黄志强;;最小最大概率分类的财务预警模型[J];统计与决策;2013年06期

2 董乐红;耿国华;高原;;Boosting算法综述[J];计算机应用与软件;2006年08期



本文编号:2733622

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/2733622.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cb17b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com