当前位置:主页 > 管理论文 > 货币论文 >

基于分类集成的Lendingclub数据中客户违约预测

发布时间:2021-05-16 13:53
  近年来随着网络时代的迅速发展,互联网金融产品迅猛发展起来,大型的借贷平台也逐步兴起,Lending Club是其中一家发展迅速、运作较好的大型P2P(Peer to Peer)交易平台,由于P2P平台交易门槛低、流程简单、投资回报率高等优势,迅速吸引了大批量客户进入市场,从中也衍生出了一些违规贷款和欺诈事件,所以本文以LendingClub公司2018年10月1日到2018年12月31日的批贷数据进行建模分析,通过集成分类预测的方法进行风险评估,提高P2P平台关于违约率较高客户的识别能力,从而为该平台及公司提供科学决策依据。本文主要运用机器学习算法进行评估预测,通过Synthetic Minority Oversam-pling Technique(SMOTE)方法对不平衡数据进行过采样,对特征进行衍生及筛选,并在此基础上使用网格搜索算法对Logistic Regression(LR),Random Forest(RF),eXtreme Gradient Boosting(XGBoost),Light Gradient Boosting Machine(LightGBM)等模型进行参数... 

【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校

【文章页数】:51 页

【学位级别】:硕士

【文章目录】:
中文摘要
Abstract
第一章 绪论
    1 研究背景及意义
    2 研究现状
    3 论文研究内容及结构安排
第二章 基本算法与评价指标
    1 Logistic Regression
    2 基本树类算法
        2.1 ID3算法
        2.2 C4.5算法
        2.3 CART算法
        2.4 决策树剪枝
    3 集成树类算法
        3.1 随机森林
        3.2 XGBoost算法
        3.3 LightGBM算法
    4 不平衡数据处理
        4.1 基于数据的方法
        4.2 基于算法的方法
    5 分类预测评价指标
    6 可解释模型
第三章 Lending Club数据描述及建模分析
    1 数据描述
    2 数据特征及预处理
    3 建模分析
    4 模型融合
    5 模型可解释
第四章 总结与展望
    1 研究结论
    2 研究局限性
参考文献
致谢



本文编号:3189808

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/huobilw/3189808.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户47079***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com