集成学习在互联网借贷反欺诈中的应用研究
发布时间:2021-06-23 03:11
本文介绍了基于集成学习的互联网借贷反欺诈方法的研究。互联网借贷反欺诈是互联网金融领域中的一个重要研究方向,传统的互联网借贷反欺诈算法大多基于规则。本文主要使用了多种机器学习算法训练反欺诈模型,并结合模型原理与场景特点分析了各模型性能上的差异,给出一种适合借贷反欺诈问题的交叉特征加权的模型集成策略。
【文章来源】:福建电脑. 2020,36(03)
【文章页数】:5 页
【部分图文】:
交叉特征加权的集成示意图
从上图中可以发现,基学习器中XGBoost的各项指标结果是最优秀。KS值能够达到0.5以上的只有逻辑回归、线性核SVM、高斯核SVM、lightGBM以及XGBoost这五个学习器。各个学习器的ROC曲线对比图,如图3所示,其中前五张图为各学习器ROC曲线,第六张图为所有ROC曲线的比较。由图3可以看到,XGBoost模型和LightGBM模型的效果在该借贷数据集上是最优秀的,也是最稳定的。在使用同样特征的情况下,各个模型的差距都不是很大,AUC都达到了0.8以上,效果最好的XGBoost模型和LightGBM模型更是达到了0.82以上。将以上所有学习器的效果,从不同的评价指标进行对比之后,找到对于借贷数据集效果最好、最稳定的学习器作为集成策略的基学习器。最终选择将逻辑回归、线性核SVM、高斯核SVM、LightGBM与XGBoost作为集成策略的基学习器。
本文使用的是某公司的借贷数据集,通过上一节特征提取的方法得到了处理好特征的训练集与测试集。为了得到性能较好的学习器作为集成策略的基学习器,使用特征训练各个常用的学习器,通过实验比较,得到各个学习器在反欺诈任务上的适应性与性能优劣,选择性能较好的若干个学习器作为集成策略的基学习器。各个学习器的效果如图2所示。从上图中可以发现,基学习器中XGBoost的各项指标结果是最优秀。KS值能够达到0.5以上的只有逻辑回归、线性核SVM、高斯核SVM、lightGBM以及XGBoost这五个学习器。各个学习器的ROC曲线对比图,如图3所示,其中前五张图为各学习器ROC曲线,第六张图为所有ROC曲线的比较。
【参考文献】:
期刊论文
[1]P2P网络借贷平台中借款人违约风险影响因素研究——以WDW为例[J]. 顾慧莹,姚铮. 上海经济研究. 2015(11)
本文编号:3244108
【文章来源】:福建电脑. 2020,36(03)
【文章页数】:5 页
【部分图文】:
交叉特征加权的集成示意图
从上图中可以发现,基学习器中XGBoost的各项指标结果是最优秀。KS值能够达到0.5以上的只有逻辑回归、线性核SVM、高斯核SVM、lightGBM以及XGBoost这五个学习器。各个学习器的ROC曲线对比图,如图3所示,其中前五张图为各学习器ROC曲线,第六张图为所有ROC曲线的比较。由图3可以看到,XGBoost模型和LightGBM模型的效果在该借贷数据集上是最优秀的,也是最稳定的。在使用同样特征的情况下,各个模型的差距都不是很大,AUC都达到了0.8以上,效果最好的XGBoost模型和LightGBM模型更是达到了0.82以上。将以上所有学习器的效果,从不同的评价指标进行对比之后,找到对于借贷数据集效果最好、最稳定的学习器作为集成策略的基学习器。最终选择将逻辑回归、线性核SVM、高斯核SVM、LightGBM与XGBoost作为集成策略的基学习器。
本文使用的是某公司的借贷数据集,通过上一节特征提取的方法得到了处理好特征的训练集与测试集。为了得到性能较好的学习器作为集成策略的基学习器,使用特征训练各个常用的学习器,通过实验比较,得到各个学习器在反欺诈任务上的适应性与性能优劣,选择性能较好的若干个学习器作为集成策略的基学习器。各个学习器的效果如图2所示。从上图中可以发现,基学习器中XGBoost的各项指标结果是最优秀。KS值能够达到0.5以上的只有逻辑回归、线性核SVM、高斯核SVM、lightGBM以及XGBoost这五个学习器。各个学习器的ROC曲线对比图,如图3所示,其中前五张图为各学习器ROC曲线,第六张图为所有ROC曲线的比较。
【参考文献】:
期刊论文
[1]P2P网络借贷平台中借款人违约风险影响因素研究——以WDW为例[J]. 顾慧莹,姚铮. 上海经济研究. 2015(11)
本文编号:3244108
本文链接:https://www.wllwen.com/falvlunwen/xingfalunwen/3244108.html