基于分类集成的Lendingclub数据中客户违约预测
发布时间:2021-05-16 13:53
近年来随着网络时代的迅速发展,互联网金融产品迅猛发展起来,大型的借贷平台也逐步兴起,Lending Club是其中一家发展迅速、运作较好的大型P2P(Peer to Peer)交易平台,由于P2P平台交易门槛低、流程简单、投资回报率高等优势,迅速吸引了大批量客户进入市场,从中也衍生出了一些违规贷款和欺诈事件,所以本文以LendingClub公司2018年10月1日到2018年12月31日的批贷数据进行建模分析,通过集成分类预测的方法进行风险评估,提高P2P平台关于违约率较高客户的识别能力,从而为该平台及公司提供科学决策依据。本文主要运用机器学习算法进行评估预测,通过Synthetic Minority Oversam-pling Technique(SMOTE)方法对不平衡数据进行过采样,对特征进行衍生及筛选,并在此基础上使用网格搜索算法对Logistic Regression(LR),Random Forest(RF),eXtreme Gradient Boosting(XGBoost),Light Gradient Boosting Machine(LightGBM)等模型进行参数...
【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校
【文章页数】:51 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
第一章 绪论
1 研究背景及意义
2 研究现状
3 论文研究内容及结构安排
第二章 基本算法与评价指标
1 Logistic Regression
2 基本树类算法
2.1 ID3算法
2.2 C4.5算法
2.3 CART算法
2.4 决策树剪枝
3 集成树类算法
3.1 随机森林
3.2 XGBoost算法
3.3 LightGBM算法
4 不平衡数据处理
4.1 基于数据的方法
4.2 基于算法的方法
5 分类预测评价指标
6 可解释模型
第三章 Lending Club数据描述及建模分析
1 数据描述
2 数据特征及预处理
3 建模分析
4 模型融合
5 模型可解释
第四章 总结与展望
1 研究结论
2 研究局限性
参考文献
致谢
本文编号:3189808
【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校
【文章页数】:51 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
第一章 绪论
1 研究背景及意义
2 研究现状
3 论文研究内容及结构安排
第二章 基本算法与评价指标
1 Logistic Regression
2 基本树类算法
2.1 ID3算法
2.2 C4.5算法
2.3 CART算法
2.4 决策树剪枝
3 集成树类算法
3.1 随机森林
3.2 XGBoost算法
3.3 LightGBM算法
4 不平衡数据处理
4.1 基于数据的方法
4.2 基于算法的方法
5 分类预测评价指标
6 可解释模型
第三章 Lending Club数据描述及建模分析
1 数据描述
2 数据特征及预处理
3 建模分析
4 模型融合
5 模型可解释
第四章 总结与展望
1 研究结论
2 研究局限性
参考文献
致谢
本文编号:3189808
本文链接:https://www.wllwen.com/guanlilunwen/huobilw/3189808.html