基于自适应集成学习模型的信用风险评估研究
发布时间:2020-10-20 06:40
近年来,随着经济全球化及金融自由化进程的不断深入,我国的消费金融服务发展迅速。同时,随着互联网特别是移动互联网的全面普及,互联网消费金融信贷规模出现了爆发式的增长,越来越多的人开始使用互联网消费金融服务。政府监管政策的相继出台倒逼互联网消费金融为代表的消费金融行业进行更深入的改革与创新。金融机构获利方式需要从以用户规模为基础的粗放型信贷模式向以用户质量为基础的集约型信贷模式转变。金融机构的信用风险管理水平决定了其盈利能力,是其在激烈的同行业竞争中脱颖而出的关键因素。如何构建更加科学、合理、有效的信用风险评估模型已成为当前信用风险评估研究的重要内容。信用风险评估模型本质上是一个二分类问题,即如何把信贷申请人中信用好的申请人和信用差的申请人区分出来。在以往的研究成果中,已有许多国内外学者对信用风险评估领域进行了深入的研究和探讨,提出了众多适用于不同数据类型的信用风险评估模型,但也存在着一些不足之处,如较少使用混合特征模型对信用风险评估数据进行特征选择研究,较少对集成模型中的基分类器进行集成选择研究等。本文基于已有的研究成果,首先对信用风险评估研究的背景和意义进行了详细地阐述,从传统专家经验模型研究、单一分类器模型研究、组合模型研究三个角度系统梳理了国内外信用风险评估的研究状况,并对特征选择、分类器算法、分类器集成等三方面相关知识和技术进行了详细介绍。在此基础上,本文提出了两种具有自适应功能的信用风险评估模型:(1)本文提出了一种数据样本自适应的信用风险评估集成模型。首先,设计了一种改进型平衡级联算法用对超出阈值的不平衡数据进行处理,有效解决不平衡数据对模型的干扰;其次,使用两种基于决策树算法的集成分类器(随机森林和XGBoost算法)作为集成模型的基分类器,有效保障集成模型的分类预测性能;最后,使用堆叠法进行分类器集成从而构建具有更高预测性能的信用风险评估集成模型。(2)本文进一步提出了一种多阶段自适应的信用风险评估集成模型。首先,本文提出一种改进型多种群小生境遗传算法(EMPNGA)用于特征选择;其次,通过结合多种特征选择过滤法与EMPNGA算法,构建混合特征选择算法用以进行自适应特征选择,有效去除冗余特征;再次,构建一个带有多个基分类器的候选分类器池,并通过进一步改进EMPNGA算法和结合基分类器先验知识,从候选分类器池中自适应地筛选出最优的分类器子集;最后,将最优分类器子集通过堆叠法构建具有更高预测性能的信用风险评估集成模型。为了验证上述两种模型的整体性能,本文采用4个真实数据集和4个评价指标对本文提出的模型进行多维度对比分析。实验结果表明:(1)在不平衡数据中,改进型平衡级联算法能有效提升分类器预测性能;(2)经过特征选择的分类模型性能均优于未进行特征选择的分类模型性能;(3)EMPNGA算法与标准二进制GA算法和标准二进制粒子群算法(PSO)相比具有更好的优化性能;(4)与其它5种特征选择方法相比,结合HEMPNGA算法的信用风险评估模型能获得更好的预测效果;(5)多阶段自适应的信用风险评估集成模型的预测结果比其它对比模型具有更好的预测性能。综上所述,实验证明本文提出的模型和算法均具有更优异的性能。本文的研究成果是对信用风险评估领域研究现有成果的创新和发展,为信用风险评估领域的理论研究提供了新的研究视角和方法,具有良好的理论价值。此外,本文的研究成果有利于防范我国金融消费与信用风险评估领域产生的系统性金融风险,有利于提高金融机构的竞争力,为金融机构实现快速、合理、高效放贷提供技术支持,具有良好的应用价值。
【学位单位】:浙江财经大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:C815
【部分图文】:
成模型用于信用风险评估。出多阶段自适应的信用风险评估集成模型。首先多种特征选择过滤法与 EMPNGA 算法相结合构建候选分类器池,池中包含根据上文提出方法所步改进 EMPNGA 算法并构建分类器选择过程;器子集并通过堆叠法构建集成模型。验设计和实验结果分析。首先,介绍本研究所使息;其次,描述实验的数据预处理过程和参数指标和显著性检验方法;最后,对实验结果进结与展望。对全文的工作进行总结与归纳,同时来研究的工作方向进行展望。技术路线如图 1-1 所示。
1( )Nt tiC N H T Nαα== +1( ) logktk tktit tN NH TN N== 向量机(SVM)Cortes 和 Vapnik 在 1995 年提出,它在小样本、高纬的分类性能。其基本思想是:建立一个最优超平面用其两类样本点到超平面的距离最大化。对于一个具有过不断更新超平面的角度直到训练样本中不同类别面分割,并且在满足条件的超平面中最大化样本点和到 SVM 的最优分类效果。SVM 最优分类示意图如
图 2-3 分类器集成效果图据基分类器的构造,分类器集成可分为同质集成和异质集成两大指将相同的基分类器进行集成,典型的分类器为 RF 算法、梯度提DT;Friedman,2001)、极限梯度提升决策树(XGBoost)。异同类型的分类器预测相同的数据,所得的结果进行优势互补以弥补的不足,从而获得更好的学习结果(Xia 等,2018)。目前,装袋法(B、提升法(Schapire,1990)和堆叠法(Wolpert,1992)是三种使集成学习方法。、装袋法袋法的英文名称为 Bagging(bootstrap aggregating 的缩写形式),始数据集的不同随机样本子集来构造多个不同的基模型,并对所有结果进行综合以产生最终的预测结果,这是一种能够减少估计方差示意图如图 2-4 所示。例如,我们可以在不同的数据子集上训练 算集成结果,如式 2.23 所示,其中,T 表示基模型个数。
【参考文献】
本文编号:2848360
【学位单位】:浙江财经大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:C815
【部分图文】:
成模型用于信用风险评估。出多阶段自适应的信用风险评估集成模型。首先多种特征选择过滤法与 EMPNGA 算法相结合构建候选分类器池,池中包含根据上文提出方法所步改进 EMPNGA 算法并构建分类器选择过程;器子集并通过堆叠法构建集成模型。验设计和实验结果分析。首先,介绍本研究所使息;其次,描述实验的数据预处理过程和参数指标和显著性检验方法;最后,对实验结果进结与展望。对全文的工作进行总结与归纳,同时来研究的工作方向进行展望。技术路线如图 1-1 所示。
1( )Nt tiC N H T Nαα== +1( ) logktk tktit tN NH TN N== 向量机(SVM)Cortes 和 Vapnik 在 1995 年提出,它在小样本、高纬的分类性能。其基本思想是:建立一个最优超平面用其两类样本点到超平面的距离最大化。对于一个具有过不断更新超平面的角度直到训练样本中不同类别面分割,并且在满足条件的超平面中最大化样本点和到 SVM 的最优分类效果。SVM 最优分类示意图如
图 2-3 分类器集成效果图据基分类器的构造,分类器集成可分为同质集成和异质集成两大指将相同的基分类器进行集成,典型的分类器为 RF 算法、梯度提DT;Friedman,2001)、极限梯度提升决策树(XGBoost)。异同类型的分类器预测相同的数据,所得的结果进行优势互补以弥补的不足,从而获得更好的学习结果(Xia 等,2018)。目前,装袋法(B、提升法(Schapire,1990)和堆叠法(Wolpert,1992)是三种使集成学习方法。、装袋法袋法的英文名称为 Bagging(bootstrap aggregating 的缩写形式),始数据集的不同随机样本子集来构造多个不同的基模型,并对所有结果进行综合以产生最终的预测结果,这是一种能够减少估计方差示意图如图 2-4 所示。例如,我们可以在不同的数据子集上训练 算集成结果,如式 2.23 所示,其中,T 表示基模型个数。
【参考文献】
相关期刊论文 前10条
1 段薇;路向阳;;基于代价敏感支持向量机的银行信用风险评估模型[J];江西科技师范大学学报;2015年06期
2 亓慧;王文剑;郭虎升;;一种基于特征选择的SVM Bagging集成方法[J];小型微型计算机系统;2014年11期
3 贺德荣;蒋白纯;;面向社会管理的个人信用评价指标体系研究和设计[J];电子政务;2013年05期
4 王润华;;基于改进支持向量机的消费信贷中个人信用评估模型[J];统计与决策;2010年11期
5 郭小燕;;主成份分析法在银行个人信用评价中的应用[J];计算机与信息技术;2009年05期
6 王莉莉;刘同明;石亮;曹敢;;基于决策树方法的银行客户信用评估[J];江南大学学报(自然科学版);2007年06期
7 肖文兵;费奇;万虎;;基于支持向量机的信用评估模型及风险评价[J];华中科技大学学报(自然科学版);2007年05期
8 姜明辉;袁绪川;;GA改进的统计组合模型在个人信用评估中的应用[J];哈尔滨工业大学学报(社会科学版);2007年01期
9 刘军丽;陈翔;;基于决策树的个人住房贷款信用风险评估模型[J];计算机工程;2006年13期
10 沈杰;;西方发达国家个人诚信制度及其运行机制[J];社会科学管理与评论;2006年02期
本文编号:2848360
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2848360.html