基于不平衡集成分类的个人信用评分研究
发布时间:2021-03-12 00:05
个人信用评分领域通常存在不平衡样本分类问题,“好”客户的数量远多于“坏”客户的数量。在这种情况下,如果直接将传统机器学习中的分类算法应用于个人信用评分,分类结果往往更加偏向于多数类样本,对少数类样本的分类效果差,从而无法正确高效地识别“坏”客户。针对个人信用评分中存在的不平衡样本分类问题,本文从数据分布调整和分类器构造两个层面进行了积极探索。(1)提出了一种基于噪声样本过滤的聚类过采样算法(Classification Filter-K-Means-SMOTE,CF-KM-SMOTE),该算法首先去除原始不平衡样本集中的噪声样本,并在样本聚类后的各簇中对少数类样本完成SMOTE过采样。CF-KM-SMOTE可将新生成的少数类样本控制在少数类区间内,有效解决了SMOTE过采样可能存在的模糊边界问题。(2)提出了一种基于CF-KM-SMOTE的个人信用评分的集成学习方法。该方法在集成学习的迭代过程中使用CF-KM-SMOTE生成新的“坏”客户样本,从而解决不平衡样本对个人信用评分的分类影响,并在Boosting集成的迭代过程中动态改变样本权重,增加了因样本量少而易被错分的“坏”客户样本的权...
【文章来源】:西北师范大学甘肃省
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
ROC曲线
SMOTE原理图
Ionosphere经各过采样后使用逻辑回归分类的ROC曲线
本文编号:3077332
【文章来源】:西北师范大学甘肃省
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
ROC曲线
SMOTE原理图
Ionosphere经各过采样后使用逻辑回归分类的ROC曲线
本文编号:3077332
本文链接:https://www.wllwen.com/guanlilunwen/bankxd/3077332.html