基于随机森林的P2P贷款信用风险评价方法
发布时间:2021-09-03 07:05
近年来,P2P贷款行业高速发展,已成为我国重要的金融产业之一,为我国经济发展带来了诸多的机遇。P2P贷款在为个人融资带来便利的同时,也存在贷款违约率高的问题,阻碍了P2P贷款行业的正常发展。P2P贷款信用风险评价研究也成为企业与学者们关注的重点。随着人工智能浪潮的来袭,基于机器学习的P2P贷款信用风险评价方法以精准的预测精度受到了P2P贷款平台和学者们的青睐,但现有研究仍存在不足。一方面,以贷款违约率最小化或预测准确率最大化为目标的机器学习方法,无法保证投资者在P2P贷款投资过程中收益的最大化;另一方面,与逻辑回归和评分卡等传统信用风险评价方法相比,基于机器学习的P2P贷款信用风险评价方法缺乏可解释性,预测结果无法被投资者与P2P贷款平台完全信任。针对上述问题,本文进行了以下两方面研究。(1)针对机器学习方法无法保证P2P贷款投资者收益最大化的局限,本文采用遗传算法对P2P贷款信用风险评价中表现较好的随机森林模型进行了改进(GA-RF),提出了以投资者收益函数(Profit score)为目标的基于GA-RF的信用风险评价方法。本文首先从投资者实际收益与实际损失和潜在收益与潜在损失四个...
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景与问题提出
1.2 研究意义
1.3 技术路线与主要研究内容
2 相关文献综述
2.1 P2P贷款信用风险评价方法研究现状
2.1.1 传统信用风险评价方法研究
2.1.2 基于机器学习的信用风险评价方法研究
2.2 随机森林改进研究现状
2.3 机器学习模型可解释性研究现状
2.3.1 分解式方法
2.3.2 教学式方法
3 以投资者收益评价函数为目标的基于GA-RF的信用风险评价方法
3.1 投资者收益评价函数Profit score
3.2 方法框架
3.3 基于遗传算法的随机森林优化
3.3.1 问题描述
3.3.2 遗传算法
3.4 实验与分析
3.4.1 数据集与特征选择
3.4.2 模型评价准则
3.4.3 随机森林参数优化
3.4.4 实验设置
3.4.5 实验结果分析
3.4.6 讨论与建议
4 一种面向可解释信用风险评价的改进教学式方法
4.1 改进教学式方法框架
4.2 基于Weight-SMOTE的伪数据集抽样方法
4.3 教学式方法评价指标
4.4 实验与分析
4.4.1 模型评价准则
4.4.2 实验设置
4.4.3 实验结果与讨论
结论
参考文献
攻读硕士学位期间发表学术论文情况
攻读硕士期间参与项目情况
致谢
【参考文献】:
期刊论文
[1]改进随机森林的集成分类方法预测结直肠癌存活性[J]. 王宇燕,王杜娟,王延章,Yaochu Jin. 管理科学. 2017(01)
[2]参数优化随机森林算法的土地覆盖分类[J]. 周天宁,明冬萍,赵睿. 测绘科学. 2017(02)
[3]基于决策树的神经网络规则抽取方法[J]. 侯广坤,张劲峰. 中山大学学报(自然科学版). 2000(04)
硕士论文
[1]基于P2P网络借贷的个人信用风险评估[D]. 彭康.暨南大学 2018
[2]P2P网络借贷的信用评分研究[D]. 李燕伟.哈尔滨工业大学 2018
[3]基于随机森林的P2P网贷借款人信用风险评估研究[D]. 田桂英.湖南大学 2018
[4]基于加权决策树的随机森林模型优化[D]. 马晓东.华中师范大学 2017
[5]随机森林在P2P网贷借款信用风险评估中的应用[D]. 徐婷婷.山东大学 2017
[6]信用卡申请的自动化审核管理方案及应用研究[D]. 吴晓旭.上海交通大学 2013
本文编号:3380652
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景与问题提出
1.2 研究意义
1.3 技术路线与主要研究内容
2 相关文献综述
2.1 P2P贷款信用风险评价方法研究现状
2.1.1 传统信用风险评价方法研究
2.1.2 基于机器学习的信用风险评价方法研究
2.2 随机森林改进研究现状
2.3 机器学习模型可解释性研究现状
2.3.1 分解式方法
2.3.2 教学式方法
3 以投资者收益评价函数为目标的基于GA-RF的信用风险评价方法
3.1 投资者收益评价函数Profit score
3.2 方法框架
3.3 基于遗传算法的随机森林优化
3.3.1 问题描述
3.3.2 遗传算法
3.4 实验与分析
3.4.1 数据集与特征选择
3.4.2 模型评价准则
3.4.3 随机森林参数优化
3.4.4 实验设置
3.4.5 实验结果分析
3.4.6 讨论与建议
4 一种面向可解释信用风险评价的改进教学式方法
4.1 改进教学式方法框架
4.2 基于Weight-SMOTE的伪数据集抽样方法
4.3 教学式方法评价指标
4.4 实验与分析
4.4.1 模型评价准则
4.4.2 实验设置
4.4.3 实验结果与讨论
结论
参考文献
攻读硕士学位期间发表学术论文情况
攻读硕士期间参与项目情况
致谢
【参考文献】:
期刊论文
[1]改进随机森林的集成分类方法预测结直肠癌存活性[J]. 王宇燕,王杜娟,王延章,Yaochu Jin. 管理科学. 2017(01)
[2]参数优化随机森林算法的土地覆盖分类[J]. 周天宁,明冬萍,赵睿. 测绘科学. 2017(02)
[3]基于决策树的神经网络规则抽取方法[J]. 侯广坤,张劲峰. 中山大学学报(自然科学版). 2000(04)
硕士论文
[1]基于P2P网络借贷的个人信用风险评估[D]. 彭康.暨南大学 2018
[2]P2P网络借贷的信用评分研究[D]. 李燕伟.哈尔滨工业大学 2018
[3]基于随机森林的P2P网贷借款人信用风险评估研究[D]. 田桂英.湖南大学 2018
[4]基于加权决策树的随机森林模型优化[D]. 马晓东.华中师范大学 2017
[5]随机森林在P2P网贷借款信用风险评估中的应用[D]. 徐婷婷.山东大学 2017
[6]信用卡申请的自动化审核管理方案及应用研究[D]. 吴晓旭.上海交通大学 2013
本文编号:3380652
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3380652.html