当前位置:主页 > 经济论文 > 银行论文 >

基于多源数据融合的个人信用风险模型研究

发布时间:2020-03-19 04:01
【摘要】:自1993年推行金融体制改革以来,我国金融体系的发展得到了极大的改善,国民的消费水平和消费观念也逐步发生变化,信贷业务得到了很大的发展,尤其是个人消费信贷突飞猛进,住房按揭、汽车贷款等信贷业务范围不断扩大,信用卡消费也越来越普及。信用卡业务的发展和规模的扩大为用户提供了便利,为商业银行带来了收益,但随之而来的信贷风险已成为商业银行的主要风险之一。关于个人信用风险评估模型的研究已经有很多,但并未发现有学者基于多源数据进行分析。由于我国经济发展呈现城乡二元化特征,城乡居民消费观念、消费习惯和消费能力等都存在一定的差别,进而对个人信用产生影响,所以本文认为应把城市和农村的信用数据看作多源数据进行分析。对于这类数据,如果简单地合并所有数据进行分析,可能会忽略数据集间的差异性,而完全分开又会遗漏关联性。本文利用整合分析方法,提出了基于多源数据融合的Logistic模型,在Composite MCP(Minimax Concave Penalty)惩罚的基础上添加Sign-based惩罚,鼓励数据集间共同变量的系数符号相似,尽可能提取变量组内相似性,构建cMCPs(cMCP惩罚+Sign-based惩罚)模型,对个人信用数据进行分析。本文使用的方法属于双层变量选择方法,利用组坐标下降法求解最优化问题,并以样本外预测准确率(Accuracy)、真正率(TPR)和AUC(AreaUnderCurve)值作为评价模型预测效果的标准。在三组模拟实验中,将cMCPs模型同cMCP模型、分数据集MCP模型进行对比,并从变量选择效果和分类效果两方面进行评价,发现cMCPs模型具有优势,且数据集间相似性越大优势越明显。在实证分析方面,采用某商业银行信用卡部的数据进行分析,在进行分析时分别采用合并数据的MCP-Logistic回归、分数据集的MCP-Logistic回归、基于cMCPs的Logistic回归模型。实证结果表明,cMCPs模型Accuracy值、TPR值和AUC值最高,模型在实际问题分析中是适用的,进而表明将城市和农村作为多源数据进行分析是合理的。
【图文】:

均匀分布,箱线图,显著变量


、变量大部分相同和显著变量小部分相同三种情况。我们预期该方法在显著变量完逡逑全相同时表现最好,此时变量相似性最大,该方法通过提炼相似度能够增加模型逡逑效果;预计在小部分显著变量相同时表现不佳,彼此之间相似性小,提取出的相逡逑似性可能较难提高模型效果。逡逑3.3.1模拟一(显著变量完全相同)逡逑模拟一中四个数据集具有相同的变量结构,每个数据集均有13个显著变量,逡逑为(X「,灯,13'#,#,#,%,#,%,%,,#,#,%),其中/?邋=邋1,.",从,真逡逑实模型的显著系数共有52个,从服从(2,3)的均匀分布中产生。逡逑为了更直观比较各模型预测准确率的结果,我们将100次模拟结果的准确率逡逑绘制箱线图如3-1所示:逡逑ho邋—邋0.2ho邋m邋0.7逦band_1逦bnnd_2逡逑

箱线图,符号


逦cMCP逦HCP逡逑图3_1模拟一邋Accuracy箱线图①逡逑①Composite邋MCP惩罚方法简称cMCP,邋cMCPs表示添加了符号惩罚的cMCP,其中s代表Sign-based惩逡逑罚,下同。逡逑33逡逑
【学位授予单位】:厦门大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F832.4

【参考文献】

相关期刊论文 前10条

1 马双鸽;王小燕;方匡南;;大数据的整合分析方法[J];统计研究;2015年11期

2 蒋_g;高瑜;;基于KMV模型的中国上市公司信用风险评估研究[J];中央财经大学学报;2015年09期

3 胡小宁;何晓群;马学俊;;基于Group MCP Logistic模型的个人信用评价分析[J];现代管理科学;2015年08期

4 何晓群;胡小宁;;个人信用评价影响因素决策分析[J];征信;2015年02期

5 张国政;陈维煌;刘呈辉;;基于Logistic模型的商业银行个人消费信贷风险评估研究[J];金融理论与实践;2015年03期

6 史小康;何晓群;;个人信用风险评分的贝叶斯有偏连接模型研究[J];统计与信息论坛;2015年02期

7 王小燕;方匡南;谢邦昌;;Logistic回归的双层变量选择研究[J];统计研究;2014年09期

8 史小康;何晓群;;有偏logistic回归模型及其在个人信用评级中的应用研究[J];数理统计与管理;2015年06期

9 方匡南;章贵军;张惠颖;;基于Lasso-logistic模型的个人信用风险预警方法[J];数量经济技术经济研究;2014年02期

10 廖国民;涂稳华;宁静;;基于Logistic模型的个人消费信贷风险评估[J];广东外语外贸大学学报;2013年05期

相关博士学位论文 前1条

1 朱艳玲;基于惩罚似然的变量选择方法及其在高维数据中的应用[D];对外经济贸易大学;2017年



本文编号:2589676

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/2589676.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2db44***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com