基于Stacking选择性集成算法的个人信用风险评估研究

发布时间:2021-10-30 23:53
  随着我国信用经济的快速发展,信贷消费、个人无抵押贷款等业务在各类金融机构中所占的比例越来越大,信用消费方式在我国经济和人们日常生活中的应用也得到了极大的提高和扩展。如何均衡消费信贷业务的规模与个人信贷的违约比率,是目前学术界研究的主要技术性问题之一,也是我国商业银行等各类金融机构在发展中有待解决的战略性技术问题。而这些技术性问题归根结底就是要如何解决金融机构个人信贷的配给风险问题。在个人信贷的配给中,最主要的技术性难题就是如何科学准确的选择个人贷款者,而个人信用风险评估恰好能解决这一问题。通过对个人基本属性、借贷相关等信息并利用机器学习方法进行研究,来量化信用风险,从而对解决个人信贷配给问题具有重要的意义。本文首先选取了Kaggle竞赛平台的信用违约预测(Give Me Some Credit)数据,并对其数据进行了大量的预处理和描述性分析。在本文第四章节中,预处理过程中依据缺失特征的分布情况选择众数填补了缺失值,并根据箱线图法的判别结果剔除了特征中的极端异常值,还绘制了特征的相关系数热力图发现逾期笔数这三个特征之间存在共线性,通过保留重要特征,取另外两个特征比值的方式消除了共线性的影... 

【文章来源】:云南财经大学云南省

【文章页数】:70 页

【学位级别】:硕士

【部分图文】:

基于Stacking选择性集成算法的个人信用风险评估研究


用户月收入和家属数量核密度曲线图

热力,相关系数,共线性


第三章样本数据的优化研究11图3.2特征相关系数热力图从上面的相关系数热力图中,我们可以看出逾期笔数这三个特征有很高的共线性,两两之间的相关系数均达到了0.9以上。考虑去除共线性,我们通过对比这三个特征和违约标识(是否违约)的相关系数,发现特征逾期30-59天的笔数和违约标识之间的相关系为0.13,相对较高。因此,我们考虑保留特征逾期30-59天的笔数,并取另外两个逾期笔数特征的比值。再绘制去除共线性的逾期笔数特征相关系数热力图如下:图3.3去除共线性的相关系数热力图

共线性,热力,相关系数


第三章样本数据的优化研究11图3.2特征相关系数热力图从上面的相关系数热力图中,我们可以看出逾期笔数这三个特征有很高的共线性,两两之间的相关系数均达到了0.9以上。考虑去除共线性,我们通过对比这三个特征和违约标识(是否违约)的相关系数,发现特征逾期30-59天的笔数和违约标识之间的相关系为0.13,相对较高。因此,我们考虑保留特征逾期30-59天的笔数,并取另外两个逾期笔数特征的比值。再绘制去除共线性的逾期笔数特征相关系数热力图如下:图3.3去除共线性的相关系数热力图

【参考文献】:
期刊论文
[1]基于IGSO-BP协同集成算法的社交网络用户信用评价方法研究[J]. 袁章帅,袁晓萌,徐孟帆.  科技经济导刊. 2019(06)
[2]个人信用评分模型比较数据挖掘分析[J]. 李卯.  时代金融. 2017(06)
[3]基于随机森林融合朴素贝叶斯的信用评估模型[J]. 叶晓枫,鲁亚会.  数学的实践与认识. 2017(02)
[4]基于信息增益和Bagging集成学习算法的个人信用评估模型研究[J]. 曹杰,邵笑笑.  数学的实践与认识. 2016(08)
[5]从微观角度研究信贷配给[J]. 王婷,江钰媛.  中国集体经济. 2015(36)
[6]基于优化CBR的个人信用评分研究[J]. 姜明辉,许佩,韩旖桐,覃志.  中国软科学. 2014(12)
[7]数据挖掘模型在小企业主信用评分领域的应用[J]. 王磊,范超,解明明.  统计研究. 2014(10)
[8]选择性集成学习算法综述[J]. 张春霞,张讲社.  计算机学报. 2011(08)
[9]美国个人信用评分体系研究及启示[J]. 白云峰,毕强.  现代管理科学. 2010(12)
[10]商业银行信用风险预警模型的实证研究[J]. 刘倩.  财经理论与实践. 2010(04)

博士论文
[1]基于选择性集成算法的个人信用评分方法研究[D]. 陈昊洁.哈尔滨工业大学 2016
[2]信贷配给微观机理研究[D]. 王征.辽宁大学 2011
[3]个人信用评分组合模型研究与应用[D]. 向晖.湖南大学 2011
[4]信用评分理论与应用研究[D]. 刘弢.湖南大学 2010

硕士论文
[1]数据分类算法性能的大规模实验对比分析[D]. 刘畅畅.河南大学 2016
[2]基于优化的xgboost-LMT模型的供应商信用评价研究[D]. 樊鹏.广东工业大学 2016
[3]基于预警理论的商业银行信贷风险管理评价体系研究[D]. 吴亚琴.浙江工业大学 2012
[4]投票式组合预测模型在个人信用评估中的应用研究[D]. 王雪.哈尔滨工业大学 2011
[5]基于组合评估法的风险评估模型研究及其系统实现[D]. 但强.电子科技大学 2009



本文编号:3467654

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3467654.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b7ca9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com