基于数据挖掘的我国P2P网络借贷违约预测模型研究
发布时间:2017-10-10 20:33
本文关键词:基于数据挖掘的我国P2P网络借贷违约预测模型研究
更多相关文章: P2P网络借贷 信息不对称 数据挖掘 非平衡数据 违约预测模型
【摘要】:近年来随着互联网+思维的广泛传播,深入到社会各行各业,互联网给金融产业带来了巨大的变革,在此基础上诞生的P2P网络借贷平台也面临着由初始的蓬勃发展转向激烈竞争的局面。P2P网络借贷(Peer-to-peer)允许个人通过平台面向广大公众进行借贷,该笔借贷一般为无担保贷款,并且无需银行等金融机构的介入。P2P平台由于其自身特性,在借款方和出借方的借贷过程中不需要第三方机构如银行的加入,防控平台风险主要依靠的是个人信用评级制度,然而我国目前还没有明确的法律监管措施,平台对借款方的信用信息收集成本高,公民征信体系不健全。由于信息的不对称,借款人对自身借款的用途、还款意愿、偿还能力等都十分清楚,而出借方却不完全拥有借款人的全部信息,这种情况下产生的道德风险和良币驱逐现象都十分普遍,导致借款方违约欺诈现象频发。出借方无法准确判断该笔借贷存在的风险大小,对平台.无法信任,最终可能会导致P2P市场运行效率低下,长此以往P2P行业发展势必受到严重的阻碍。截止2015年底,P2P问题平台达到896家,涉及资金超过80亿元。本研究通过引入数据挖掘算法,使用人工非平衡数据对几种经典的数据挖掘算法进行性能的对比,最终选择随机森林算法构建模型。随机森林模型能够将借款方的相关信息全部加入解释变量中,而不需要对变量进行编码,归一化处理,进行交叉检验及精炼,可以避免删除隐藏的有效信息。研究收集了国内某龙贷P2P网络借贷平台13万条数据,经过数据的预处理最终获得122804条有效数据,使用随机森林算法构建了P2P网络借贷借款方违约行为预测模型。通过Dist指标对模型进行优化,从研究的结果上看,预测模型对测试集的预测结果表明了模型具有良好的性能,其中模型的准确率达到0.978,查全率为0.7002,AUC值为0.803。可以为我国的P2P网络借贷风险控制提供一定的参考价值。
【关键词】:P2P网络借贷 信息不对称 数据挖掘 非平衡数据 违约预测模型
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;F832.4;F724.6
【目录】:
- 摘要4-5
- Abstract5-9
- 1 绪论9-14
- 1.1 研究背景9-11
- 1.1.1 现实背景9-10
- 1.1.2 理论背景10-11
- 1.2 研究目的和研究意义11-12
- 1.2.1 研究目的11-12
- 1.2.2 研究意义12
- 1.3 研究内容和论文结构12-13
- 1.4 主要创新点13-14
- 2 文献综述14-35
- 2.1 P2P网络借贷理论14-17
- 2.1.1 P2P网络借贷基本概念与特征14-15
- 2.1.2 信息不对称理论15-16
- 2.1.3 P2P网络借贷违约理论16-17
- 2.2 P2P网络借贷风险控制理论17-19
- 2.2.1 国外P2P网络借贷风险控制研究17-18
- 2.2.2 国内P2P网络借贷风险控制研究18-19
- 2.3 数据挖掘理论19-33
- 2.3.1 数据挖掘算法概述19-20
- 2.3.2 数据挖掘算法特征20
- 2.3.3 数据挖掘算法的应用20-21
- 2.3.4 数据挖掘经典算法21-33
- 2.4 非平衡数据理论33-34
- 2.4.1 非平衡数据概述33
- 2.4.2 非平衡数据处理方法33-34
- 2.5 文献综述小结34-35
- 3 模型算法的选择与模型构建35-41
- 3.1 模型性能的评价标准35-36
- 3.2 模型算法的对比36-40
- 3.2.1 逻辑回归算法37
- 3.2.2 神经网络算法37-38
- 3.2.3 随机森林算法38-39
- 3.2.4 算法小结39-40
- 3.3 模型构建40-41
- 4 实证分析41-47
- 4.1 研究案例的选取41
- 4.2 数据的收集41-43
- 4.3 数据的预处理与数据描述43-44
- 4.4 软件介绍44
- 4.5 模型预测44-46
- 4.6 结果分析46-47
- 5 模型优化47-54
- 5.1 优化思路47-48
- 5.2 优化方法48-51
- 5.2.1 阈值调整48-49
- 5.2.2 Dist指标49-50
- 5.2.3 优化后的模型50-51
- 5.3 优化结果51-54
- 6 研究结论与展望54-56
- 6.1 研究结论54
- 6.2 研究创新点54
- 6.3 研究局限性54-55
- 6.4 未来研究方向55-56
- 参考文献56-59
- 攻读硕士学位期间发表学术论文情况59-60
- 致谢60-61
【参考文献】
中国期刊全文数据库 前10条
1 王雅轩;顼聪;;数据挖掘技术的综述[J];电子技术与软件工程;2015年08期
2 刘绘;沈庆R,
本文编号:1008496
本文链接:https://www.wllwen.com/jingjilunwen/touziyanjiulunwen/1008496.html