基于不平衡数据的FL-lightgbm算法研究及其应用
发布时间:2024-06-06 04:30
随着人们消费观念的改变,“超前消费”的概念被越来越多的人所认可,消费金融迎来了蓬勃发展。它能使用户提前负担起暂时无法负担的商品,加速商品流转,在一定程度上促进了经济的发展。消费金融贷款有着小额、无抵押、无担保的特点,这些特点使消费金融贷款在惠及更多中低收入人群的同时,也为消费金融公司带来了贷款违约的风险。本文尝试用机器学习的方法预测用户违约的风险,降低消费金融公司的坏账率。传统的机器学习方法通常假设数据是均匀分布的,但消费金融贷款数据的分布是不平衡的,即未违约用户的数量远大于违约用户的数量,在这种情况下,采用传统的算法会导致模型过多地关注未违约用户的样本,导致对少数违约用户的错分,这种错分会给消费金融公司造成极大代价。因此研究消费金融贷款中的不平衡的违约数据分类问题有重要意义。本文基于消费金融公司捷信的贷款违约数据,对用户是否违约进行预测。首先对数据做了预处理和探索性分析,并根据数据特点构建新特征,选取xgboost模型中重要性排名前150的特征构建模型;其次本文选取xgboost和前沿的lightgbm模型分别建模,采用AUC作为评估指标,发现lightgbm模型整体上优于xgboo...
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
本文编号:3990308
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
第1章绪论上海师范大学硕士学位论文4图1-1技术路线图1.4本文主要贡献本文使用捷信提供的消费金融贷款数据,分别构造xgboost、lightgbm及改进损失函数的lightgbm模型来预测用户贷款违约概率,并采用AUC进行评判。对不同算法的AUC值进行对比,可以发现改进损失函数....
上海师范大学硕士学位论文第3章基于损失函数的focalloss改进19图3-1损失函数的单调递减形式yf(x)被称为margin,其作用类似于回归问题中的残差yf(x)。常见的二分类损失函数主要有以下几种:(1)0-1损失(0-1loss)0-1loss是最原始的损失函数,它直接....
第3章基于损失函数的focalloss改进上海师范大学硕士学位论文20()11fxpe公式(3-5)可表示如下图图3-2二元交叉熵的损失表示则可得损失函数L[ylogp(1y)log(1p)]公式(3-6)即()()()()11[log(1)log(1)]NiiiiiLypypn....
第3章基于损失函数的focalloss改进上海师范大学硕士学位论文20()11fxpe公式(3-5)可表示如下图图3-2二元交叉熵的损失表示则可得损失函数L[ylogp(1y)log(1p)]公式(3-6)即()()()()11[log(1)log(1)]NiiiiiLypypn....
本文编号:3990308
本文链接:https://www.wllwen.com/guanlilunwen/huobilw/3990308.html