当前位置:主页 > 经济论文 > 国际贸易论文 >

P2P网络借贷违约的随机森林预测模型

发布时间:2022-01-13 14:56
  进入21世纪,互联网+思维作为知识创新的新成果,被广泛应用到各行各业,同时也在金融行业中掀起一阵互联网+金融的浪潮。P2P网络借贷平台作为互联网+金融的产物,它既可以为拥有闲置资金的人提供保值、增值的途径,又可以为资金周转困难、需要融资的企业或个人提供筹资渠道。P2P网络借贷起源于英国,是由网络信贷公司提供平台,借贷双方根据自己的意愿和需求自由竞价,促成成交的一种借贷模式。这种借贷模式具有利率高,操作方便、借贷手续少等特点,很快传入我国形成互联网金融,成为一个备受关注的新兴产业。但我国公民信用体系尚未规范,网贷平台无法保证贷款申请人的信息是否真实,信息不对称,很难控制信用风险,导致借款方网络违约现象频发,给网络借贷平台带来难以弥补的损失。为了控制借贷的风险,需要对申请贷款者的违约进行评估和预测,尽可能降低损失,保证P2P网贷行业的健康、稳健的发展。本文将数据发掘方法引入P2P网贷违约行为预测分析中,通过对C4.5决策树,CART决策树和随机森林几种经典的决策树模型的性能进行对比,最终选取模型性能最优的随机森林算法构建模型。随机森林模型不但对非平衡数据的包容性良好,而且不受特征变量间具有... 

【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校

【文章页数】:38 页

【学位级别】:硕士

【部分图文】:

P2P网络借贷违约的随机森林预测模型


决策树示意图

示意图,森林,示意图,学习器


图 3.2 随机森林示意图Figure3.2 The Random Forest diagram.2 模型性能的评价标准对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还量模型泛化能力的评价标准,也就是性能度量。本文研究的是二分类问样例根据其真实类别与学习器预测类别的组合划分成真正例(true positive(false positive)、真反例(true negative)、假反例(false negative)四种情况,的混淆矩阵如表 3.1 所示。表 3.1 分类结果混淆矩阵Table3.1The confusion matrix of classification result预测结果真实情况 正例 反例正例 TP(真正立) FN(假反例)

ROC曲线,决策树,ROC曲线,森林


图 3.4 CART 决策树 ROC 曲线Figure3.4ROC of CART tree用随机森林模型对训练集对模型进行构建,再将训练好的分类器对测,随机森林模型对测试集预测得到的 ROC 曲线如图 3.4,经计算,性能最优。

【参考文献】:
期刊论文
[1]P2P借贷平台风险分析[J]. 赵彬丞,张嘉卿,赖俊明.  当代经济. 2016(04)
[2]大数据是数据、技术,还是应用[J]. 朱扬勇,熊赟.  大数据. 2015(01)
[3]非平衡大数据下的保险欺诈识别研究[J]. 范广哲,刘瑾雯.  中国新通信. 2015(01)
[4]P2P网贷的风险分析及防控对策[J]. 马亮.  金融经济. 2014(12)

硕士论文
[1]基于P2P网络借贷平台的个人信用风险评估研究[D]. 张利坤.哈尔滨理工大学 2016
[2]P2P网络借贷违约风险研究[D]. 康莹莹.山东财经大学 2016
[3]基于P2P网络借贷平台的投资人风险研究[D]. 刘本喜.首都经济贸易大学 2014
[4]P2P网络借贷平台的中介职能分析[D]. 陈莉.湖南大学 2013



本文编号:3586645

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3586645.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户20cd4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com