基于非平衡数据集的P2P网络借贷违约预测研究
发布时间:2024-04-08 22:24
P2P网络借贷是一种个人对个人的在线借款方式,相对于传统借贷模式,具有无需抵押、线上申请、放款迅速的特点。我国的P2P平台经历了一段时间的繁荣增长期,迅速成为个人融资的重要渠道之一,但“繁荣发展”的背后面临着很多的问题,使得2016年开始P2P行业频频暴雷。究其原因,一是没有健全的监管制度和法律体系导致不合规平台众多;二是没有完善的信用体系,信息不对称严重;三是很多平台没有合适的风控体系,导致用户违约率居高不下。因此如何提高平台对违约用户的识别能力,对于P2P行业的健康发展具有重要意义。一般来说,违约用户的数量要远小于正常用户的数量,所以网贷数据集是类不均衡的,如果利用传统的算法进行模型训练会产生很多问题,所以本文从不同的角度对传统算法进行了改进。从众多的学习算法中选择了逻辑回归算法、BP神经网络、E-LightGBM算法,并从解决类不均衡问题的角度对算法进行改进。从代价敏感学习的角度,提出了cost-LR算法和cost-BP算法,对逻辑回归和BP神经网络中的交叉熵损失函数加权处理,使得违约样本预测为正常样本要付出更大的代价;从数据层面出发,提出了E-LightGBM算法:利用Easy...
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
中文摘要
ABSTRACT
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 研究方法与技术路线
第二章 P2P网络借贷的信用风险
2.1 P2P网络借贷的起源
2.2 机器学习与P2P网贷信用风险
第三章 违约预测模型框架
3.1 数据获取与理解
3.2 用户画像
3.3 特征工程
3.3.1 数据预处理
3.3.2 特征衍生与选择
3.4 类不平衡问题
3.4.1 基于数据层面解决类不均衡问题
3.4.2 基于算法层面解决类不均衡问题
3.5 模型构建与评估
3.5.1 cost-LR和 cost-BP
3.5.2 E-LightGBM算法
3.5.3 模型评估
第四章 实例分析
4.1 基于美国LendingClub平台的分析
4.1.1 构建简单的违约用户画像
4.1.2 构建违约预测模型
4.2 基于中国拍拍贷平台的分析
4.2.1 构建简单的违约用户画像
4.2.2 构建违约预测模型
4.3 拍拍贷与LendingClub对比分析
第五章 结论与展望
5.1 研究总结与创新点
5.2 研究展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式
本文编号:3948902
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
中文摘要
ABSTRACT
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 研究方法与技术路线
第二章 P2P网络借贷的信用风险
2.1 P2P网络借贷的起源
2.2 机器学习与P2P网贷信用风险
第三章 违约预测模型框架
3.1 数据获取与理解
3.2 用户画像
3.3 特征工程
3.3.1 数据预处理
3.3.2 特征衍生与选择
3.4 类不平衡问题
3.4.1 基于数据层面解决类不均衡问题
3.4.2 基于算法层面解决类不均衡问题
3.5 模型构建与评估
3.5.1 cost-LR和 cost-BP
3.5.2 E-LightGBM算法
3.5.3 模型评估
第四章 实例分析
4.1 基于美国LendingClub平台的分析
4.1.1 构建简单的违约用户画像
4.1.2 构建违约预测模型
4.2 基于中国拍拍贷平台的分析
4.2.1 构建简单的违约用户画像
4.2.2 构建违约预测模型
4.3 拍拍贷与LendingClub对比分析
第五章 结论与展望
5.1 研究总结与创新点
5.2 研究展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式
本文编号:3948902
本文链接:https://www.wllwen.com/shoufeilunwen/jjglss/3948902.html