当前位置:主页 > 法律论文 > 刑法论文 >

集成学习在互联网借贷反欺诈中的应用研究

发布时间:2021-06-23 03:11
  本文介绍了基于集成学习的互联网借贷反欺诈方法的研究。互联网借贷反欺诈是互联网金融领域中的一个重要研究方向,传统的互联网借贷反欺诈算法大多基于规则。本文主要使用了多种机器学习算法训练反欺诈模型,并结合模型原理与场景特点分析了各模型性能上的差异,给出一种适合借贷反欺诈问题的交叉特征加权的模型集成策略。 

【文章来源】:福建电脑. 2020,36(03)

【文章页数】:5 页

【部分图文】:

集成学习在互联网借贷反欺诈中的应用研究


交叉特征加权的集成示意图

学习器


从上图中可以发现,基学习器中XGBoost的各项指标结果是最优秀。KS值能够达到0.5以上的只有逻辑回归、线性核SVM、高斯核SVM、lightGBM以及XGBoost这五个学习器。各个学习器的ROC曲线对比图,如图3所示,其中前五张图为各学习器ROC曲线,第六张图为所有ROC曲线的比较。由图3可以看到,XGBoost模型和LightGBM模型的效果在该借贷数据集上是最优秀的,也是最稳定的。在使用同样特征的情况下,各个模型的差距都不是很大,AUC都达到了0.8以上,效果最好的XGBoost模型和LightGBM模型更是达到了0.82以上。将以上所有学习器的效果,从不同的评价指标进行对比之后,找到对于借贷数据集效果最好、最稳定的学习器作为集成策略的基学习器。最终选择将逻辑回归、线性核SVM、高斯核SVM、LightGBM与XGBoost作为集成策略的基学习器。

学习器


本文使用的是某公司的借贷数据集,通过上一节特征提取的方法得到了处理好特征的训练集与测试集。为了得到性能较好的学习器作为集成策略的基学习器,使用特征训练各个常用的学习器,通过实验比较,得到各个学习器在反欺诈任务上的适应性与性能优劣,选择性能较好的若干个学习器作为集成策略的基学习器。各个学习器的效果如图2所示。从上图中可以发现,基学习器中XGBoost的各项指标结果是最优秀。KS值能够达到0.5以上的只有逻辑回归、线性核SVM、高斯核SVM、lightGBM以及XGBoost这五个学习器。各个学习器的ROC曲线对比图,如图3所示,其中前五张图为各学习器ROC曲线,第六张图为所有ROC曲线的比较。

【参考文献】:
期刊论文
[1]P2P网络借贷平台中借款人违约风险影响因素研究——以WDW为例[J]. 顾慧莹,姚铮.  上海经济研究. 2015(11)



本文编号:3244108

资料下载
论文发表

本文链接:https://www.wllwen.com/falvlunwen/xingfalunwen/3244108.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ecc78***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com