当前位置:主页 > 管理论文 > 信贷论文 >

基于不平衡集成分类的个人信用评分研究

发布时间:2021-03-12 00:05
  个人信用评分领域通常存在不平衡样本分类问题,“好”客户的数量远多于“坏”客户的数量。在这种情况下,如果直接将传统机器学习中的分类算法应用于个人信用评分,分类结果往往更加偏向于多数类样本,对少数类样本的分类效果差,从而无法正确高效地识别“坏”客户。针对个人信用评分中存在的不平衡样本分类问题,本文从数据分布调整和分类器构造两个层面进行了积极探索。(1)提出了一种基于噪声样本过滤的聚类过采样算法(Classification Filter-K-Means-SMOTE,CF-KM-SMOTE),该算法首先去除原始不平衡样本集中的噪声样本,并在样本聚类后的各簇中对少数类样本完成SMOTE过采样。CF-KM-SMOTE可将新生成的少数类样本控制在少数类区间内,有效解决了SMOTE过采样可能存在的模糊边界问题。(2)提出了一种基于CF-KM-SMOTE的个人信用评分的集成学习方法。该方法在集成学习的迭代过程中使用CF-KM-SMOTE生成新的“坏”客户样本,从而解决不平衡样本对个人信用评分的分类影响,并在Boosting集成的迭代过程中动态改变样本权重,增加了因样本量少而易被错分的“坏”客户样本的权... 

【文章来源】:西北师范大学甘肃省

【文章页数】:54 页

【学位级别】:硕士

【部分图文】:

基于不平衡集成分类的个人信用评分研究


ROC曲线

基于不平衡集成分类的个人信用评分研究


SMOTE原理图

基于不平衡集成分类的个人信用评分研究


Ionosphere经各过采样后使用逻辑回归分类的ROC曲线


本文编号:3077332

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/bankxd/3077332.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b8ba4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com