基于RF-SMOTE-XGboost下的银行用户个人信用风险评估模型
发布时间:2024-04-27 03:11
大数据时代下,用户信用数据中的高维稀疏特征与样本不平衡现象日益显著。为处理高维特征,文中采用随机森林(RF)从Filter和Wrapper角度进行特征提取,并用SMOTE算法对训练集样本做采样处理。模型训练阶段使用粒子群优化算法对XGboost模型做分类精度提高。最后,采用一开源银行数据集提供的数据进行实例验证。结果表明,相较于一般的GBDT模型和网格搜索法,所建立的模型在评估时具有更好的精度与收敛性。
【文章页数】:6 页
【文章目录】:
0 引言
1 混合式高维稀疏特征处理
2 模型优化
2.1 过采样平衡样本
2.2 XGboost算法
2.3 XGboost算法参数优化
2.4 XGboost模型实现流程
3 实证分析
3.1 实验数据
3.2 特征选择
3.3 模型优化与结果分析
4 结语
本文编号:3965269
【文章页数】:6 页
【文章目录】:
0 引言
1 混合式高维稀疏特征处理
2 模型优化
2.1 过采样平衡样本
2.2 XGboost算法
2.3 XGboost算法参数优化
2.4 XGboost模型实现流程
3 实证分析
3.1 实验数据
3.2 特征选择
3.3 模型优化与结果分析
4 结语
本文编号:3965269
本文链接:https://www.wllwen.com/jingjifazhanlunwen/3965269.html