基于Stacking的P2P贷款违约预测模型构建及应用
发布时间:2023-03-29 19:11
近年来互联网金融与大数据技术的发展使得传统金融机构的中介作用下降,互联网金融理财观念日渐深入人心,大众逐渐把P2P网络借贷作为金融消费理财的重要途径。国内P2P网贷行业因此迅速发展,但是在快速发展的背后伴随的问题与风险也在逐步提高,2018年我国P2P网贷平台出现集中爆雷潮,发生了大面积的客户违约现象,高坏账率导致大量平台出现资金提现困难、倒闭等现象,因此如何准确识别潜在违约客户,降低信用违约风险变成迫在眉睫的问题,只有将借款客户的信用违约问题处理好,才能够更好的促进我国P2P网络贷款行业平稳健康发展。本文旨在通过建立贷款违约预测模型,对P2P网贷平台潜在违约客户进行准确识别,以期能够降低平台经营风险,优化我国互联网金融环境,降低互联网金融风险。针对目前我国P2P平台风险量化研究较少,运用机器学习算法较单一且缺乏运用多模型融合策略的实际情况,本文利用Python爬取人人贷借贷数据,借助Python、R等分析软件,首先进行了数据预处理和Cox生存分析等探索性统计分析,在对非平衡数据使用Border-line Smot算法处理后,通过IV信息价值与Gini指数相结合的特征筛选方法,构建Lo...
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外P2P网贷违约风险相关研究综述
1.2.1 国外相关研究综述
1.2.2 国内相关研究综述
1.3 Stacking模型融合算法研究综述
1.4 论文主要内容与技术路线
1.5 论文创新点
1.6 论文结构
第2章 P2P网贷相关理论及发展现状
2.1 P2P网贷相关概念
2.1.1 P2P网贷概述
2.1.2 P2P网贷角色关系
2.1.3 P2P网贷业务流程
2.2 P2P网络借贷风险
2.3 P2P网络借贷发展现状
2.3.1 P2P平台规模特征
2.3.2 P2P平台信用风险问题日益严重
2.4 本章小节
第3章 机器学习分类算法理论
3.1 机器学习概述
3.2 机器学习分类算法
3.2.1 单分类算法
3.2.2 集成学习算法
3.3 Stacking模型融合算法
3.4 本章小节
第4章 模型数据获取与预处理
4.1 数据获取
4.2 数据预处理
4.2.1 数据清洗
4.2.2 数据缺失值处理
4.2.3 数据离群点处理
4.2.4 数据特征抽象
4.2.5 数据特征缩放
4.3 非平衡数据处理
4.4 本章小节
第5章 贷款数据探索与统计分析
5.1 贷款生存时间分析
5.2 贷款违约影响因素分析
5.2.1 贷款违约与借款特征关系分析
5.2.2 贷款违约与借款人特征关系分析
5.2.3 贷款违约与地理位置特征关系分析
5.3 本章小节
第6章 基于Stacking算法的模型构建与应用
6.1 特征工程
6.1.1 特征衍生
6.1.2 特征筛选
6.2 模型构建
6.2.1 模型评价指标
6.2.2 模型的有效性评估方式
6.2.3 模型优化与比较
6.2.4 稳定性检验
6.2.5 构建Stacking融合模型与结果分析
6.3 模型应用分析
6.3.1 客户区分能力检验
6.3.2 样本外数据检验
6.3.3 不良客户转化
6.3.4 模型应用建议
6.4 本章小节
结论
致谢
参考文献
攻读学位期间取得学术成果
本文编号:3774314
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外P2P网贷违约风险相关研究综述
1.2.1 国外相关研究综述
1.2.2 国内相关研究综述
1.3 Stacking模型融合算法研究综述
1.4 论文主要内容与技术路线
1.5 论文创新点
1.6 论文结构
第2章 P2P网贷相关理论及发展现状
2.1 P2P网贷相关概念
2.1.1 P2P网贷概述
2.1.2 P2P网贷角色关系
2.1.3 P2P网贷业务流程
2.2 P2P网络借贷风险
2.3 P2P网络借贷发展现状
2.3.1 P2P平台规模特征
2.3.2 P2P平台信用风险问题日益严重
2.4 本章小节
第3章 机器学习分类算法理论
3.1 机器学习概述
3.2 机器学习分类算法
3.2.1 单分类算法
3.2.2 集成学习算法
3.3 Stacking模型融合算法
3.4 本章小节
第4章 模型数据获取与预处理
4.1 数据获取
4.2 数据预处理
4.2.1 数据清洗
4.2.2 数据缺失值处理
4.2.3 数据离群点处理
4.2.4 数据特征抽象
4.2.5 数据特征缩放
4.3 非平衡数据处理
4.4 本章小节
第5章 贷款数据探索与统计分析
5.1 贷款生存时间分析
5.2 贷款违约影响因素分析
5.2.1 贷款违约与借款特征关系分析
5.2.2 贷款违约与借款人特征关系分析
5.2.3 贷款违约与地理位置特征关系分析
5.3 本章小节
第6章 基于Stacking算法的模型构建与应用
6.1 特征工程
6.1.1 特征衍生
6.1.2 特征筛选
6.2 模型构建
6.2.1 模型评价指标
6.2.2 模型的有效性评估方式
6.2.3 模型优化与比较
6.2.4 稳定性检验
6.2.5 构建Stacking融合模型与结果分析
6.3 模型应用分析
6.3.1 客户区分能力检验
6.3.2 样本外数据检验
6.3.3 不良客户转化
6.3.4 模型应用建议
6.4 本章小节
结论
致谢
参考文献
攻读学位期间取得学术成果
本文编号:3774314
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/3774314.html