基于重抽样法处理不平衡问题的信用评级模型
【部分图文】:
(b)对于样本资源不足的中小型金融机构,令τ=4,在“好”客户中随机不重复抽取(20/τ)×n个样本组成样本集G11,G11的样本容量为(20/τ)×n=5n。移除Β1组变量,在其余4组变量组成的样本集{Β2,…,Β5}中不重复抽取n个样本组成样本集B′11,运用样本集B′11与{Β2,…,Β5}组成样本集Β-11={B′11,Β2,…,Β5},Β-11的样本容量为5n。运用样本集G11和Β-11组成训练集TR11={G11,Β-11}(如图2所示)。再次操作上述抽取“好”客户的过程4次,获得样本集G12,…,G15,操作抽取“坏”客户的过程4次,获得样本集B′12,…,B′15,分别与{Β2,…,Β5}组成样本集Β-12={B′12,Β2,…,Β5},…,Β-15={B′15,Β2,…,Β5}。利用样本集G12,…,G15和Β-12,…,Β-15组成训练集TR12={G12,Β-12},…,TR15={G15,Β-15}。第3步,将步骤2中的Β1分别替换为Β2,重复以上操作获得训练集TR21={G21,Β-21},…,TR25={G25,Β-25}。利用Β3、Β4和Β5进行相同的替换,获得其他训练集。
难点之四是如何确定调整后“好”客户与“坏”客户的比例,来确保模型在倾向表现“坏”客户的同时不过度减少贷款产品的市场份额。伴随欠抽样方法对建模数据的调整,“坏”客户占比不断提升,由评级模型所代表的贷款审核机制变得更为严格,贷款申请的通过率降低,进而导致贷款产品的市场份额下降。信用评级模型的分类效果可以用混淆矩阵表示(如图1所示),其中TP和TN代表被正确分类的客户数,FN和FP代表被错误分类的客户数。“坏”客户被正确预测的比例为P1=TP/(TP+FN),“好”客户被正确预测的比例为P2=TN/(TN+FP),一般来说,运用不平衡数据建模时P1<P2,运用平衡数据建模时P1≈P2。混淆矩阵可以转化成一个2×2的列联表,可以从统计学角度进行列联表卡方检验,选取P1显著大于P2时的客户类别比例。难点之五是如何在众多信用评级模型中选取合适的模型,可以适应信用评级领域的应用要求。Logistic模型在我国信用评级工作中应用最为广泛,SVM模型次之,其他分类模型较少被采用。内蕴线性形式使得Logistic模型的函数形式相对简单,模型的可解释性良好,分类效果较好,因而在实践中颇受欢迎。此外,为确保变量影响的稳定性,实践中常对数值型变量进行栏位划分(数据分组),评级模型中会加入较多的分类变量。Logistic group lasso(LGLM)模型融合了Logistic模型的解释性优势、Group lasso模型变量选择和处理分类变量的优势,将此模型作为本研究的基学习模型较为适宜。设定(xi,yi),i=1,…,n是观测样本,yi∈{0,1}是二值响应变量,xi=(xi,1,…,xi,G)是包含G个组的p维协变量。对于第g组变量,g=1,…,G,当其维度大于1时,该组代表分类变量;当维度等于1时,实际上它是连续变量。Logistic模型通过(1)式估计条件概率p(xi)=Pr(Y=1|xi),即:
【相似文献】
相关期刊论文 前10条
1 刘丽萍;;高维稀疏对角GARCH模型的估计及应用[J];数学的实践与认识;2017年11期
2 蒋福坤;变额还贷的按揭贷款模型研究[J];浙江统计;2004年03期
3 黄长征;赵崇新;;农村二元金融模型与分成制模型辨析[J];现代商业;2011年24期
4 聂巧平;胡冰倩;;GARCH模型族及其在金融市场中的应用研究综述[J];天津商业大学学报;2020年02期
5 刘吕科;;模型风险及其控制研究[J];农村金融研究;2012年04期
6 邹柏松;;信用风险分类预测单一模型研究及实证分析[J];武汉冶金管理干部学院学报;2017年02期
7 孟勇;;对Black-Litterman模型加入主观收益方法的改进[J];统计研究;2012年02期
8 刘超;;商业银行风险管理模型的性质及启示[J];上海金融;2011年03期
9 戴玉林;;马科维兹模型的分析与评价[J];金融研究;1991年09期
10 胡楠;;“消息”在汇率模型中扮演了怎样的角色?[J];时代金融;2015年32期
相关博士学位论文 前10条
1 周伊佳;带有共享不确定参数的鲁棒优化模型[D];大连理工大学;2017年
2 张运鹏;基于GARCH模型的金融市场风险研究[D];吉林大学;2009年
3 黄薏舟;无模型隐含波动率及其所包含的信息研究[D];厦门大学;2009年
4 许一览;人民币对公贷款违约概率计量模型研究[D];复旦大学;2014年
5 彭伟;CAViaR模型方法及其实证研究[D];华中科技大学;2015年
6 汪卢俊;STAR-GARCH模型的理论与应用研究[D];南开大学;2014年
7 黄建忠;商业银行违约损失率估计模型构建研究[D];南京农业大学;2011年
8 耿立艳;非线性金融波动率模型及其实证研究[D];天津大学;2009年
9 刘鹏;投资组合保险模型研究[D];西南交通大学;2012年
10 向晖;个人信用评分组合模型研究与应用[D];湖南大学;2011年
相关硕士学位论文 前10条
1 顾洲一;基于高频数据的分数整合Realized HAR GARCH模型[D];浙江财经大学;2017年
2 张勔;基于优化的Black-Litterman模型证券资产配置研究[D];中国科学技术大学;2015年
3 丁慎勇;反欺诈模型在电子银行的应用研究[D];山东大学;2014年
4 张娇艳;基于DEJ-GARCH-Vasicek模型的利率跳跃行为研究[D];湖南大学;2014年
5 孙凯;GARCH模型簇在我国金融领域应用的探讨[D];兰州大学;2010年
6 王敏;非参数条件自回归极差模型及其应用[D];西南财经大学;2013年
7 焦鹏;基于模糊GARCH模型的中国股票市场波动性研究[D];西南财经大学;2011年
8 林萍;货币主义汇率模型及其实证研究[D];武汉大学;2005年
9 李知常;基于Black-Litterman模型的资产配置策略研究[D];山东大学;2017年
10 叶蜜冬;基于中国市场的最优套期保值比率模型绩效实证检验[D];厦门大学;2009年
本文编号:2888856
本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/2888856.html