当前位置:主页 > 经济论文 > 投融资论文 >

商业银行信贷逾期的预测

发布时间:2020-04-08 19:10
【摘要】:随着社会的发展,我们国家信贷市场规模急剧扩大,商业银行的发展前景呈现出新的气象。与此同时,防范个人信贷欺诈,降低信贷不良率也成为了商业银行需要研究的一个重要课题。我们国家信贷市场规模急剧扩大,但是与之相匹配的业务质量却没有得到很大的提升,特别是最近这几年,商业银行出现了一系列的问题,如贷款逾期、不良贷款等性质较为恶劣的问题,这些问题给商业银行带来了巨大的利润损失。而且,随着商业银行中金融风险的扩大,促使了潜在金融危机隐患的加大,对我国金融业的持续稳定造成了极大的影响,所以对商业银行客户是否会出现信贷逾期等情况的预测是一个必要的问题。针对商业银行信贷现状,本文利用某银行提供的客户信贷资料数据,在对原始数据进行一定的分析后,发现数据存在类别不平衡问题、部分变量存在大量缺失值和异常值,并且提供的原始变量较多,针对这些问题,本文将缺失数据很多的变量进行删除,然后根据数据的不同形式,利用决策树和线性回归将其余变量的缺失值(异常值视为缺失值)补全。对于数据类别不平衡问题,本文借助SMOTE算法将原始数据进行了重构,保证重构后的数据基本达到不同类别的样本数量相当。对数据进行处理后,本文以IV算法对原始变量进行筛选,然后结合ROC分析对筛选后的变量分别单独建立Logistic回归模型检验单个变量建立预测模型的可行性,再将ROC分析与随机森林相结合,由于不同的变量在模型中所起的重要性是不同的,因此选择累积重要性达到50%的变量进行组合,建立了逻辑回归模型,最终取AUC值最大者作为建立信贷逾期预测模型的变量。最后,利用建立的Logistic模型对商业银行信贷数据作出预测,预测准确率达到70%以上,同时将该模型与SVM模型和RF(随机森林)模型比较,根据比较结果,说明本文建立的信贷逾期预测模型具有一定的可信度,其预测结果能够作为商业银行进行决策时较为可靠的依据,提高其对信贷风险的预防,为金融机构制定正确的信用贷款政策提供理论依据。
【图文】:

原始数据,缺失,情况,信息


科技大学硕士学位论文 第四章 信贷逾期预测模型的建立及结果第四章 信贷逾期预测模型的建立及结果分析4.1 建模前的准备4.1.1 数据来源及描述性统计分析本文利用的数据为某银行提供,包括 n(n>10000)人的信贷数据,包份信息及财产状况、持卡信息、交易信息、放款信息、还款信息、申请贷等 199 个解释变量,也包含了这 n 个人的是否信贷逾期的数据。经过对原始数据观察,发现原数据中有一部分变量数据缺失严重,现用式展现,如图 4-1 所示,,具体代码见附录 1。

折线图,箱线图,具体代码,四分位数


科技大学硕士学位论文 第四章 信贷逾期预测模型的建立及结果函数返回值包括非缺失值的数量、平均数、标准差、中位数、最小值、最大四分位数和下四分位数;根据 describe 函数得到的结果计算均值、极差、方准差和变异系数,然后将这些指标汇总为一张表,并绘制折线图,利用折离散程度和量纲问题做出判断,如图 4-2 所示。在描述性统计分析时,将始数据绘制箱线图,根据箱线图判断原始数据中是否存在异常值,如图 4。具体代码见附录 3。
【学位授予单位】:广西科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F832.4

【相似文献】

相关期刊论文 前10条

1 梁慧玲;孙锋锋;丁桂芹;;基于随机森林算法的福建林火发生驱动因子分析[J];信息系统工程;2019年09期

2 范格华;;基于随机森林回归的鱼雷管峰压预测[J];信息系统工程;2019年08期

3 沈智勇;苏

本文编号:2619724


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/touziyanjiulunwen/2619724.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4d6e3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com