集成学习在互联网借贷反欺诈中的应用研究

发布时间：2021-06-23 03:11

　　本文介绍了基于集成学习的互联网借贷反欺诈方法的研究。互联网借贷反欺诈是互联网金融领域中的一个重要研究方向,传统的互联网借贷反欺诈算法大多基于规则。本文主要使用了多种机器学习算法训练反欺诈模型,并结合模型原理与场景特点分析了各模型性能上的差异,给出一种适合借贷反欺诈问题的交叉特征加权的模型集成策略。

【文章来源】：福建电脑. 2020,36(03)

【文章页数】：5 页

【部分图文】：

集成学习在互联网借贷反欺诈中的应用研究

交叉特征加权的集成示意图

学习器

从上图中可以发现，基学习器中XGBoost的各项指标结果是最优秀。KS值能够达到0.5以上的只有逻辑回归、线性核SVM、高斯核SVM、lightGBM以及XGBoost这五个学习器。各个学习器的ROC曲线对比图，如图3所示，其中前五张图为各学习器ROC曲线，第六张图为所有ROC曲线的比较。由图3可以看到，XGBoost模型和LightGBM模型的效果在该借贷数据集上是最优秀的，也是最稳定的。在使用同样特征的情况下，各个模型的差距都不是很大，AUC都达到了0.8以上，效果最好的XGBoost模型和LightGBM模型更是达到了0.82以上。将以上所有学习器的效果，从不同的评价指标进行对比之后，找到对于借贷数据集效果最好、最稳定的学习器作为集成策略的基学习器。最终选择将逻辑回归、线性核SVM、高斯核SVM、LightGBM与XGBoost作为集成策略的基学习器。

学习器

本文使用的是某公司的借贷数据集，通过上一节特征提取的方法得到了处理好特征的训练集与测试集。为了得到性能较好的学习器作为集成策略的基学习器，使用特征训练各个常用的学习器，通过实验比较，得到各个学习器在反欺诈任务上的适应性与性能优劣，选择性能较好的若干个学习器作为集成策略的基学习器。各个学习器的效果如图2所示。从上图中可以发现，基学习器中XGBoost的各项指标结果是最优秀。KS值能够达到0.5以上的只有逻辑回归、线性核SVM、高斯核SVM、lightGBM以及XGBoost这五个学习器。各个学习器的ROC曲线对比图，如图3所示，其中前五张图为各学习器ROC曲线，第六张图为所有ROC曲线的比较。

【参考文献】：
期刊论文
[1]P2P网络借贷平台中借款人违约风险影响因素研究——以WDW为例[J]. 顾慧莹,姚铮. 上海经济研究. 2015(11)

本文编号：3244108

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/falvlunwen/xingfalunwen/3244108.html

上一篇：故意的认识内容在大陆法系犯罪论体系中的演变及启示
下一篇：共享经济的非犯罪化规制研究——以共享单车为例

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|