基于RF和APSOLSSVM的两阶段信用评估研究
本文关键词:基于RF和APSOLSSVM的两阶段信用评估研究
【摘要】:在互联网飞速发展的信息时代,我们的衣食住行等生活的诸多方面都发生了翻天覆地的变化,尤其是移动互联网与金融的结合,正悄然改变着人们的消费习惯,拉动了国内的居民消费浪潮。在互联网金融对消费的刺激作用下,人们越来越依赖信用交易的方式进行消费。目前信用消费的规模正飞速增长,但信用消费在拉动经济的同时也带了诸多问题,由于我国缺乏较为公正的第三方信用评级体系,商业银行各自的客户信用信息不被共享,因此我国的个人征信系统还不完善,相应的缺乏比较全面的信息来衡量每个人的违约风险,另外,在风险的控制和管理上也存在明显不足,没有一套科学有效的信用评估体系,此外,授信额度的判定也尚未有一个明确的解决办法。而在信用交易规模的趋势日益扩大的今天,对个人信用评估的重要性和准确度的要求都越来越高,对评估方法的改进也显得尤为重要。建立一个全国共享的个人信用信息基础数据库势在必行,目前已经由中国人民银行牵头,建设一个全民社会征信制度和体系,来约束人们遵纪守法,提高诚实守信的意识。由此可见,对个人信用进行合理的预测和评估,一方面对商业银行的信用风险管理体系有一定的借鉴作用,促进银行等金融机构授信业务的稳健发展,另一方面可以在一定程度上防范金融风险,尽量规避客户的违约风险,收益性与安全性统筹兼顾。学术研究方面,国内外学者从定性和定量的角度对个人信用评估也进行了一系列的研究,涉及到计量学、统计学、人工智能和机器学习等多个领域,但目前为止尚未形成一种稳健、可靠、通用的个人信用评估模型及体系。而我国商业银行等信贷机构在个人信用评估的实际操作中,与国外尚有一定的差距,手段方法及技术比较落后:一方面主观因素较大;另一方面人工操作,效率较低。因此本文以个人信用评估方法为研究中心,结合国内外的研究及现实数据,试图构建一种新的个人信用评估方法,即将随机森林算法(Random Forest, RF).自适应粒子群优化算法(Adaptive Particle Swarm Optimization,APSO)和最小二乘支持向量机算法(Least Squares Support Vector Machine, LSSVM)结合起来,研究了新的组合模型的信用评估效果,其中利用了随机森林算法的特征向量的重要性估计做了特征选择,研究了删减重要性程度低的特征变量对模型分类性能的影响,以推动个人信用评估研究的深入,同时为商业银行提供一种可参考的信用评估方法。本文以个人信用评估方法为研究对象,引入了随机森林算法、自适应粒子群优化算法和最小二乘支持向量机算法。个人信用评估实质上可以看作是一个分类问题,即将总体客户划分为好客户(不违约客户)和坏客户(违约客户),因此个人信用评估属于模式识别的研究范围。通过选取样本数据,并进行数据的预处理,最后构建了RF和APSOLSSVM的两阶段信用评估模型,并在实证中进行了比较分析。为了实现研究目标,本文章节安排如下:第一章,引言。该章节介绍本文的选题背景和意义,研究方法、思路和章节安排。阐述目前我国信用消费的发展趋势,并指出研究个人信用评估的重要意义,总结了本文进行研究所用到的研究方法和内容框架。第二章,个人信用评估及其现状研究。理论部分的研究包括个人信用评估的理论基础,国内外已被研究应用于信用评估模型的算法理论概括,是本文的理论基础。本章节通过研究个人信用相关的基础理论和国内外算法的研究现状,对国内外个人信用评估的研究成果进行梳理,将本文涉及到的个人信用评估算法分三类进行介绍。第三章,RF-LSSVM的算法构建。本章主要讲解RF和LSSVM算法的基本原理,以及每个算法各自的特征分析,最后阐述了RF-LSSVM算法如何运用于信用评估的分类问题,算法可行的基本原理和构建组合方法的具体实现步骤。第四章,信用数据集介绍及实验前准备工作。介绍实验中涉及的4个信用数据集的样本信息,以及实验前数据预处理,阐明算法的参数设置和模型评估的标准。第五章,RF-LSSVM算法在个人信用评估中的应用。实证研究部分是将新建立的模型应用于信用数据集,通过模型之间的比较和数据集上的实证结果分析,来检验新方法的可适用程度。第六章,结论与展望。最后结论和展望部分,总结概括全文,分析不足之处以及未来可发展的方向。本文在总结国内外个人信用评估模型的基础上,提出了一种新的组合模型:RF-APSOLSSVM模型,在对模型进行实证检验时,选取了UCI机器学习公开的德国信用数据集,澳大利亚真实信用数据集和国外研究者提供的英国信用数据集、波兰信用数据集。在实验前,这些信用数据集都经过了填补缺失值、指标赋值、归一化等一系列的数据预处理。同时,本文共选取了8个比较有代表性的信用评估模型,分别在上述这四个信用数据集上建模,与本文提出的组合分类器的预测结果进行比较分析,更加全面地验证了组合模型RF-APSOLSSVM的适用性和分类的有效性。实验结果表明了本文所构建的组合模型RF-APSOLSSVM的分类性能要优于大部分的个人信用评估模型。本文的结论可以归结为以下几个方面:(1)组合模型可以取得更好的预测结果。随机森林模型具有OOB估计、特征变量重要性估计的优势,但R讧模型的预测精度与APSOLSSVM模型相比略差一些,因此RF模型通过与APSOLSSVM模型相结合,不仅可以利用到特征变量重要性的估计结果进行了特征选择操作,还可以较为良好的预测精度,在一些信用数据集上,组合模型的结果甚至优于APSOLSSVM模型。(2)不同的特征选择会带来预测结果的变化。APSOLSSVM模型的运算时间很长,RF-APSOLSSVM组合模型使得一些相对重要程度不高的变量得以删减,特征变量的删减使得组合模型的运算速度远远快于APSOLSSVM模型的运行速度,并且在分类正确率上也优于R心和APSOLSSVM模型。(3)本文提出了模型组合的一个很好的思路。由于RF模型在0.5的投票率附近区间,模型的误判率较高,因此剥离出该区域范围内的样本,交由APSOLSSVM模型进行预测,采取这种两阶段的模型组合方法,使得组合模型最后的预测结果,与RF模型的预测结果相比有大幅度的改善。综上所述,通过本文实证研究证明了RF和APSOLSSVM的两阶段组合模型不仅在理论上可行,在实证研究中也取得了较佳的分类效果。实证表明:RF-APSOLSSVM组合信用评估模型可以用于个人的信用评估领域中,是一种有效而且新颖的评估方法。
【关键词】:信用风险 信用评估 随机森林 分类
【学位授予单位】:西南财经大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F224;F203
【目录】:
- 摘要4-7
- Abstract7-14
- 1. 引言14-19
- 1.1 研究背景及研究意义14-16
- 1.2 研究方法、研究内容及创新点16-17
- 1.3 论文研究思路及章节17-19
- 2. 个人信用评估及其研究现状综述19-39
- 2.1 个人信用评估的基础理论19-21
- 2.1.1 信用的概念19-20
- 2.1.2 个人信用评估20-21
- 2.2 国内外个人信用评估文献综述21-28
- 2.2.1 国外个人信用评估研究方法文献综述23-26
- 2.2.2 国内个人信用评估研究方法文献综述26-28
- 2.3 主流的信用评估方法介绍28-39
- 3. 随机森林算法的原理及相关理论基础39-53
- 3.1 分类器及分类器的组合39-41
- 3.1.1 分类问题39-40
- 3.1.2 分类器的组合40-41
- 3.2 CART分类树41-46
- 3.2.1 CART算法原理41-42
- 3.2.2 CART分类树的建立42-44
- 3.2.3 CART分类树的剪枝44-45
- 3.2.4 CART分类树的优缺点45-46
- 3.3 BAGGING方法46
- 3.4 随机森林分类算法46-53
- 3.4.1 随机森林的建立47-49
- 3.4.2 随机森林的泛化误差49-50
- 3.4.3 OOB估计50-51
- 3.4.4 特征变量的重要性估计51-53
- 4. LSSVM算法及RF-APSOLSSVM模型的组合原理53-63
- 4.1 最小二乘支持向量机(LSSVM)53-55
- 4.2 自适应粒子群优化算法(APSO)55-57
- 4.3 基于RF-APSOLSSVM的两阶段组合模型57-63
- 4.3.1 APSOLSSVM模型的建立58-59
- 4.3.2 RF—APSOLSSVM组合模型的构建方法59-61
- 4.3.3 RF—APSOLSSVM组合模型的实现步骤61-63
- 5. 数据预处理及模型评估指标63-74
- 5.1 数据来源63-64
- 5.2 数据预处理64-72
- 5.2.1 缺失值的处理64-65
- 5.2.2 指标赋值65-67
- 5.2.3 归一化处理67-71
- 5.2.4 划分数据集71-72
- 5.3 模型评估指标72-74
- 6. 实证结果与分析74-85
- 6.1 组合模型与其他模型实证结果的比较75-80
- 6.1.1 RF-APSOLSSVM与RF、APSOLSSVM基于不同信用数据集的比较75-78
- 6.1.2 RF-APSOLSSVM与其他模型基于正确度、敏感度和特异度的比较78-80
- 6.2 特征选择对RF-APSOLSSVM分类效果的影响80-85
- 6.2.1 基于德国信用数据集80-83
- 6.2.2 基于英国信用数据集83-85
- 7. 结论与展望85-88
- 7.1 结论85-86
- 7.2 展望86-88
- 参考文献88-93
- 致谢93-95
- 在读期间科研成果目录95
【相似文献】
中国期刊全文数据库 前10条
1 温涛,冉光和,王煜宇,熊德平;农户信用评估系统的设计与运用研究[J];运筹与管理;2004年04期
2 李建平,徐伟宣,刘京礼,石勇;消费者信用评估中支持向量机方法研究[J];系统工程;2004年10期
3 孙常翔,李乃文;消费者信用评估刍议[J];甘肃科技;2005年05期
4 刘承智;;信用评估的“C”要素理论及其应用[J];财会月刊;2006年30期
5 张晓燕;兰守彬;;如何寻找海外客户及客户信用评估[J];黑龙江科技信息;2012年08期
6 赵静娴,杨宝臣;一种基于神经网络和决策树的信用评估新方法[J];武汉科技大学学报(社会科学版);2005年02期
7 郭伊扬,郭尚鸿,沈祖志;适合中小型制造企业的客户信用评估的研究[J];运筹与管理;2003年01期
8 赵亚鹏;丁以中;;客户信用评估模型[J];上海海事大学学报;2008年02期
9 李诚;;运用计算机提高信用评估的科学性[J];金融管理与研究;1990年03期
10 唐守国;大型商场消费者信用评估流程探讨[J];中国科技信息;2005年13期
中国重要会议论文全文数据库 前3条
1 刘克;穆丽颖;黎建强;;信用评估:确定贷款发放的一种方法[A];第三届不确定系统年会论文集[C];2005年
2 赵新欣;赵振全;;上市公司信用评估方法比较[A];21世纪数量经济学(第5卷)[C];2004年
3 周晓飞;石勇;;基于数据挖掘的金融信用评估概述[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年
中国重要报纸全文数据库 前10条
1 本报记者 邹大斌;众筹金融热 信用评估火[N];计算机世界;2013年
2 杨君伟;信用评估强似排行榜[N];中国财经报;2003年
3 唐有为;高效信用评估可望亦可及[N];国际商报;2001年
4 晓研;信用评估助力国际贸易[N];中华工商时报;2001年
5 《融资导刊》记者 董月梅;各自为政扰乱信用评估体系建设[N];民营经济报;2006年
6 记者 郭津;我省社会信用评估机构有了“娘家”[N];河南日报;2009年
7 杨德智;营销员信用评估系统推动诚信建设[N];中国保险报;2011年
8 本报记者 王亚宏;环境 主权信用评估新维度[N];中国证券报;2012年
9 谢建功;形成科学的信用评估体系[N];经济日报;2000年
10 张旭东;我市启动中小企业信用评估工作[N];闽北日报;2006年
中国硕士学位论文全文数据库 前10条
1 叶夏菁;基于BP神经网络与半监督学习的网贷平台信用评估模型[D];浙江大学;2015年
2 宣礼扬;企业间借贷法律规制研究[D];安徽大学;2016年
3 常轶;基于BP神经网络的A银行中小企业信用评估系统构建[D];湖南大学;2015年
4 张碧月;基于RF和APSOLSSVM的两阶段信用评估研究[D];西南财经大学;2016年
5 付源;有效规避信用评估风险的研究[D];西南石油学院;2004年
6 李国欣;中小企业信用评估研究[D];暨南大学;2006年
7 吕安民;企业工商信用评估系统的研究[D];大连理工大学;2004年
8 魏柏楠;中小企业信用评估[D];吉林大学;2014年
9 王凯;中小企业信用评估模型及应用[D];安徽农业大学;2007年
10 颜昀昕;高新技术企业融资现状及信用评估研究[D];电子科技大学;2009年
,本文编号:895111
本文链接:https://www.wllwen.com/kejilunwen/yysx/895111.html