当前位置:主页 > 经济论文 > 银行论文 >

基于重抽样法处理不平衡问题的信用评级模型

发布时间:2020-11-18 15:10
   由于履约客户的数量远远大于违约客户,征信数据具备严重的不平衡特征,常用的处理方法较少同时考虑金融机构所关注的违约损失和市场份额因素。本文基于违约损失因素提出迭代重抽样集成模型(IRIM),利用迭代欠抽样方法提升模型对"坏"客户的关注,采用集成方法将弱分类模型转变为强分类模型;基于市场份额因素改进常用的F-value指标,引入评价分类效果的RS指标。在6类不平衡关系下进行模拟研究,并对SSBF数据和中国某银行征信数据进行实证研究。结果表明,与常用的方法和指标相比,迭代重抽样集成模型能够在确保市场份额不过度减少的情况下降低金融机构的违约风险,RS指标能够恰当地权衡市场份额和违约风险的关系。
【部分图文】:

示意图,训练集,样本集,示意图


(b)对于样本资源不足的中小型金融机构,令τ=4,在“好”客户中随机不重复抽取(20/τ)×n个样本组成样本集G11,G11的样本容量为(20/τ)×n=5n。移除Β1组变量,在其余4组变量组成的样本集{Β2,…,Β5}中不重复抽取n个样本组成样本集B′11,运用样本集B′11与{Β2,…,Β5}组成样本集Β-11={B′11,Β2,…,Β5},Β-11的样本容量为5n。运用样本集G11和Β-11组成训练集TR11={G11,Β-11}(如图2所示)。再次操作上述抽取“好”客户的过程4次,获得样本集G12,…,G15,操作抽取“坏”客户的过程4次,获得样本集B′12,…,B′15,分别与{Β2,…,Β5}组成样本集Β-12={B′12,Β2,…,Β5},…,Β-15={B′15,Β2,…,Β5}。利用样本集G12,…,G15和Β-12,…,Β-15组成训练集TR12={G12,Β-12},…,TR15={G15,Β-15}。第3步,将步骤2中的Β1分别替换为Β2,重复以上操作获得训练集TR21={G21,Β-21},…,TR25={G25,Β-25}。利用Β3、Β4和Β5进行相同的替换,获得其他训练集。

矩阵图,信用评级,列联表,矩阵


难点之四是如何确定调整后“好”客户与“坏”客户的比例,来确保模型在倾向表现“坏”客户的同时不过度减少贷款产品的市场份额。伴随欠抽样方法对建模数据的调整,“坏”客户占比不断提升,由评级模型所代表的贷款审核机制变得更为严格,贷款申请的通过率降低,进而导致贷款产品的市场份额下降。信用评级模型的分类效果可以用混淆矩阵表示(如图1所示),其中TP和TN代表被正确分类的客户数,FN和FP代表被错误分类的客户数。“坏”客户被正确预测的比例为P1=TP/(TP+FN),“好”客户被正确预测的比例为P2=TN/(TN+FP),一般来说,运用不平衡数据建模时P1<P2,运用平衡数据建模时P1≈P2。混淆矩阵可以转化成一个2×2的列联表,可以从统计学角度进行列联表卡方检验,选取P1显著大于P2时的客户类别比例。难点之五是如何在众多信用评级模型中选取合适的模型,可以适应信用评级领域的应用要求。Logistic模型在我国信用评级工作中应用最为广泛,SVM模型次之,其他分类模型较少被采用。内蕴线性形式使得Logistic模型的函数形式相对简单,模型的可解释性良好,分类效果较好,因而在实践中颇受欢迎。此外,为确保变量影响的稳定性,实践中常对数值型变量进行栏位划分(数据分组),评级模型中会加入较多的分类变量。Logistic group lasso(LGLM)模型融合了Logistic模型的解释性优势、Group lasso模型变量选择和处理分类变量的优势,将此模型作为本研究的基学习模型较为适宜。设定(xi,yi),i=1,…,n是观测样本,yi∈{0,1}是二值响应变量,xi=(xi,1,…,xi,G)是包含G个组的p维协变量。对于第g组变量,g=1,…,G,当其维度大于1时,该组代表分类变量;当维度等于1时,实际上它是连续变量。Logistic模型通过(1)式估计条件概率p(xi)=Pr(Y=1|xi),即:
【相似文献】

相关期刊论文 前10条

1 刘丽萍;;高维稀疏对角GARCH模型的估计及应用[J];数学的实践与认识;2017年11期

2 蒋福坤;变额还贷的按揭贷款模型研究[J];浙江统计;2004年03期

3 黄长征;赵崇新;;农村二元金融模型与分成制模型辨析[J];现代商业;2011年24期

4 聂巧平;胡冰倩;;GARCH模型族及其在金融市场中的应用研究综述[J];天津商业大学学报;2020年02期

5 刘吕科;;模型风险及其控制研究[J];农村金融研究;2012年04期

6 邹柏松;;信用风险分类预测单一模型研究及实证分析[J];武汉冶金管理干部学院学报;2017年02期

7 孟勇;;对Black-Litterman模型加入主观收益方法的改进[J];统计研究;2012年02期

8 刘超;;商业银行风险管理模型的性质及启示[J];上海金融;2011年03期

9 戴玉林;;马科维兹模型的分析与评价[J];金融研究;1991年09期

10 胡楠;;“消息”在汇率模型中扮演了怎样的角色?[J];时代金融;2015年32期


相关博士学位论文 前10条

1 周伊佳;带有共享不确定参数的鲁棒优化模型[D];大连理工大学;2017年

2 张运鹏;基于GARCH模型的金融市场风险研究[D];吉林大学;2009年

3 黄薏舟;无模型隐含波动率及其所包含的信息研究[D];厦门大学;2009年

4 许一览;人民币对公贷款违约概率计量模型研究[D];复旦大学;2014年

5 彭伟;CAViaR模型方法及其实证研究[D];华中科技大学;2015年

6 汪卢俊;STAR-GARCH模型的理论与应用研究[D];南开大学;2014年

7 黄建忠;商业银行违约损失率估计模型构建研究[D];南京农业大学;2011年

8 耿立艳;非线性金融波动率模型及其实证研究[D];天津大学;2009年

9 刘鹏;投资组合保险模型研究[D];西南交通大学;2012年

10 向晖;个人信用评分组合模型研究与应用[D];湖南大学;2011年


相关硕士学位论文 前10条

1 顾洲一;基于高频数据的分数整合Realized HAR GARCH模型[D];浙江财经大学;2017年

2 张勔;基于优化的Black-Litterman模型证券资产配置研究[D];中国科学技术大学;2015年

3 丁慎勇;反欺诈模型在电子银行的应用研究[D];山东大学;2014年

4 张娇艳;基于DEJ-GARCH-Vasicek模型的利率跳跃行为研究[D];湖南大学;2014年

5 孙凯;GARCH模型簇在我国金融领域应用的探讨[D];兰州大学;2010年

6 王敏;非参数条件自回归极差模型及其应用[D];西南财经大学;2013年

7 焦鹏;基于模糊GARCH模型的中国股票市场波动性研究[D];西南财经大学;2011年

8 林萍;货币主义汇率模型及其实证研究[D];武汉大学;2005年

9 李知常;基于Black-Litterman模型的资产配置策略研究[D];山东大学;2017年

10 叶蜜冬;基于中国市场的最优套期保值比率模型绩效实证检验[D];厦门大学;2009年



本文编号:2888856

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/2888856.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户77653***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com