当前位置:主页 > 经济论文 > 投融资论文 >

基于特征生成和历史记录的信贷风险评估模型

发布时间:2021-10-19 12:50
  近年来,P2P(peertopeer)借贷已成为互联网金融的核心业态之一,但是借款人的违约行为却使平台遭受了资金损失,同时也不利于市场的有序发展。因此,针对借款行为进行科学合理的违约预测势在必行。现有的风险评估模型往往需要专家进行繁复的特征工程并利用借款人当前的借贷标的信息进行风险预测,该方法耗时耗力且难以揭露借款人的违约意图。因此,我们需要一个更加高效精准的风险评估模型。本文通过引入特征生成的方法,综合考虑借款人的历史记录,提出了基于特征生成和历史记录的信贷风险评估模型FHRM(Feature generation&Historical records based Risk assessment Model)来解决违约预测问题。首先,我们运用GBDT算法对借款人的标的信息进行特征生成,自动发现有效的特征与特征组合,弥补人工经验的不足,缩短模型的实验周期。然后,根据借款人的历史借贷记录,通过长短期记忆网络对借款人的借贷行为进行学习,发现高风险的序列模式。最后,我们通过训练FHRM模型,得到借款人标的的风险评估结果。通过在真实数据集Prosper上的实验结果表明,基于特征生成和历... 

【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

基于特征生成和历史记录的信贷风险评估模型


图1-1借贷平台原理图??

流程图,借款人,违约率,平台


跑誠?激??图1-2借款人借贷流程图??在信贷评估过程中,大多数模型只考虑借款人当前时刻的标的特征,因此其??预测能力在某些情况下效果表现一般。例如,部分高风险借款人会在前期进行小??金额的借款,并按时履约从而提升自己的信用分值,待信用分值达到一定阈值时,??该借款人便会申请一笔金额较大的借款并发生违约行为,从而达到欺诈目的。另??夕卜,我们统计了?Prosper平台上每年的发标数量、满标数量和满标率,如图1-3所??示。从数据中,我们可以看出虽然平台每年会产生大量的借贷标的,但是实际满??标的标的,只占其中的3%左右。不仅如此,我们还对Prosper平台拥有较多借款??记录的借款人进行分析

运行机制,准确率,分类器,森林


类别来表示,其中每棵决策树都拥有相等的权重,而在解决回归问题时,最终结??果是由决策输出的均值来决定。??从图2-1中,我们可以发现训练每一棵决策树的过程就是生成随机森林的本??质,其中每棵决策树的训练彼此相互独立的。因此,在随机森林的生成过程中,??我们可以运用并行处理技术来提高训练效率。??Original??Training?Data??Step?1:??Create?random?^^gdomize??vectors??Step?2:?I??Use?random??vectors?to?build?.?/%?/气?,气.?,’%??multiple?decision?〇\?A?A??trees??Step?3:? ̄;??Combine?decision???Majority-Voting??trees??Final-Class??图2-1随机森林的运行机制??随机森林模型在大数据问题的解决上是一种准确率相对较高的分类器。在随??15??

【参考文献】:
期刊论文
[1]基于随机森林算法的绿色信贷信用风险评估研究[J]. 李进.  金融理论与实践. 2015(11)

硕士论文
[1]随机森林在P2P网贷借款信用风险评估中的应用[D]. 徐婷婷.山东大学 2017
[2]搜索广告点击率预测中的冷启动问题研究[D]. 邓丽芳.哈尔滨工业大学 2016



本文编号:3444903

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/touziyanjiulunwen/3444903.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c2463***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com