当前位置:主页 > 经济论文 > 投融资论文 >

基于数据挖掘的我国P2P网络借贷违约预测模型研究

发布时间:2017-10-10 20:33

  本文关键词:基于数据挖掘的我国P2P网络借贷违约预测模型研究


  更多相关文章: P2P网络借贷 信息不对称 数据挖掘 非平衡数据 违约预测模型


【摘要】:近年来随着互联网+思维的广泛传播,深入到社会各行各业,互联网给金融产业带来了巨大的变革,在此基础上诞生的P2P网络借贷平台也面临着由初始的蓬勃发展转向激烈竞争的局面。P2P网络借贷(Peer-to-peer)允许个人通过平台面向广大公众进行借贷,该笔借贷一般为无担保贷款,并且无需银行等金融机构的介入。P2P平台由于其自身特性,在借款方和出借方的借贷过程中不需要第三方机构如银行的加入,防控平台风险主要依靠的是个人信用评级制度,然而我国目前还没有明确的法律监管措施,平台对借款方的信用信息收集成本高,公民征信体系不健全。由于信息的不对称,借款人对自身借款的用途、还款意愿、偿还能力等都十分清楚,而出借方却不完全拥有借款人的全部信息,这种情况下产生的道德风险和良币驱逐现象都十分普遍,导致借款方违约欺诈现象频发。出借方无法准确判断该笔借贷存在的风险大小,对平台.无法信任,最终可能会导致P2P市场运行效率低下,长此以往P2P行业发展势必受到严重的阻碍。截止2015年底,P2P问题平台达到896家,涉及资金超过80亿元。本研究通过引入数据挖掘算法,使用人工非平衡数据对几种经典的数据挖掘算法进行性能的对比,最终选择随机森林算法构建模型。随机森林模型能够将借款方的相关信息全部加入解释变量中,而不需要对变量进行编码,归一化处理,进行交叉检验及精炼,可以避免删除隐藏的有效信息。研究收集了国内某龙贷P2P网络借贷平台13万条数据,经过数据的预处理最终获得122804条有效数据,使用随机森林算法构建了P2P网络借贷借款方违约行为预测模型。通过Dist指标对模型进行优化,从研究的结果上看,预测模型对测试集的预测结果表明了模型具有良好的性能,其中模型的准确率达到0.978,查全率为0.7002,AUC值为0.803。可以为我国的P2P网络借贷风险控制提供一定的参考价值。
【关键词】:P2P网络借贷 信息不对称 数据挖掘 非平衡数据 违约预测模型
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;F832.4;F724.6
【目录】:
  • 摘要4-5
  • Abstract5-9
  • 1 绪论9-14
  • 1.1 研究背景9-11
  • 1.1.1 现实背景9-10
  • 1.1.2 理论背景10-11
  • 1.2 研究目的和研究意义11-12
  • 1.2.1 研究目的11-12
  • 1.2.2 研究意义12
  • 1.3 研究内容和论文结构12-13
  • 1.4 主要创新点13-14
  • 2 文献综述14-35
  • 2.1 P2P网络借贷理论14-17
  • 2.1.1 P2P网络借贷基本概念与特征14-15
  • 2.1.2 信息不对称理论15-16
  • 2.1.3 P2P网络借贷违约理论16-17
  • 2.2 P2P网络借贷风险控制理论17-19
  • 2.2.1 国外P2P网络借贷风险控制研究17-18
  • 2.2.2 国内P2P网络借贷风险控制研究18-19
  • 2.3 数据挖掘理论19-33
  • 2.3.1 数据挖掘算法概述19-20
  • 2.3.2 数据挖掘算法特征20
  • 2.3.3 数据挖掘算法的应用20-21
  • 2.3.4 数据挖掘经典算法21-33
  • 2.4 非平衡数据理论33-34
  • 2.4.1 非平衡数据概述33
  • 2.4.2 非平衡数据处理方法33-34
  • 2.5 文献综述小结34-35
  • 3 模型算法的选择与模型构建35-41
  • 3.1 模型性能的评价标准35-36
  • 3.2 模型算法的对比36-40
  • 3.2.1 逻辑回归算法37
  • 3.2.2 神经网络算法37-38
  • 3.2.3 随机森林算法38-39
  • 3.2.4 算法小结39-40
  • 3.3 模型构建40-41
  • 4 实证分析41-47
  • 4.1 研究案例的选取41
  • 4.2 数据的收集41-43
  • 4.3 数据的预处理与数据描述43-44
  • 4.4 软件介绍44
  • 4.5 模型预测44-46
  • 4.6 结果分析46-47
  • 5 模型优化47-54
  • 5.1 优化思路47-48
  • 5.2 优化方法48-51
  • 5.2.1 阈值调整48-49
  • 5.2.2 Dist指标49-50
  • 5.2.3 优化后的模型50-51
  • 5.3 优化结果51-54
  • 6 研究结论与展望54-56
  • 6.1 研究结论54
  • 6.2 研究创新点54
  • 6.3 研究局限性54-55
  • 6.4 未来研究方向55-56
  • 参考文献56-59
  • 攻读硕士学位期间发表学术论文情况59-60
  • 致谢60-61

【参考文献】

中国期刊全文数据库 前10条

1 王雅轩;顼聪;;数据挖掘技术的综述[J];电子技术与软件工程;2015年08期

2 刘绘;沈庆R,

本文编号:1008496


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/touziyanjiulunwen/1008496.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d850f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com