对于信用卡透支还款客户分类问题的研究

发布时间:2020-12-08 02:19
  随着信用经济的发展,近几年我国信用卡市场进入快速发展时期,持卡人增多、发卡量增大,伴随而来的信用风险随之增加。银行在现阶段拓展信用卡业务的同时,需更加重视信用卡客户带来的不良透支风险,加大审批力度,减少不必要的经济损失。本文利用商业银行现有信用卡客户数据,通过对已透支客户还款行为的研究,深入分析信用卡客户透支还款情况。首先,通过描述性统计针对重要变量进行分析,用图表的形式直观地分析影响透支还款行为的客户指标。然后,根据央行信用卡五级分类准则将客户状态变量划分为正常、关注、次级、可疑和损失五个级别,对五级分类数据进行数据预处理、数据可视化、多分类建模预测等研究。最后,以银行实际需求为导向,重点研究银行的信用卡不良透支客户分类问题,通过XGBoost、lightGBM等机器学习方法,结合不平衡数据处理和代价敏感AdaCost算法,寻找用于识别不平衡数据少数类更有效的分类器,来准确预测逾期时间较长未正常还款的客户。 

【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校

【文章页数】:53 页

【学位级别】:硕士

【部分图文】:

对于信用卡透支还款客户分类问题的研究


信用卡五级分类人数饼图

条形图,信用卡,金额,条形图


兰州大学硕士学位论文对于信用卡透支还款客户分类问题的研究图2.2信用卡五级分类透支金额条形图应的透支金额中位数,从正常级别、关注级别一直到损失级别,各类别客户的透支金额中位数呈递增态势,正常级别客户透支金额中位数约为3000元,损失级别客户透支金额中位数约为6500元,显然透支金额越大的客户还款越容易出现问题,所以银行信用卡部门在监测到客户出现高额贷款时需要特别关注。以上分析主要基于银行五级分类口径对客户透支情况进行初步介绍,下面对自变量描述性分析时将次级、可疑、损失三个类别称为不良透支,进一步分析各变量对不良透支情况的影响,其中不良透支率即为发生不良透支的客户人数占该类别客户总数的比例。3自变量描述性分析首先针对不同年龄客户分析信用卡不良透支率,得到如图2.3所示的折线图,该数据集中年龄分布在1486岁。通过观察,在3568这个年龄段,信用卡不良透支率趋势比较平稳,且处在较低水平,均小于7%,而位于两侧的年龄段35岁以下和68岁10

信用卡,可视,降维


兰州大学硕士学位论文对于信用卡透支还款客户分类问题的研究t-SNE(t-distributedstochasticneighborembedding)即t分布随机邻近嵌入,是一种非线性降维方法,在2008年由LaurensvanderMaaten和GeoffreyHinton提出[24],适用于高维数据降维到二维或三维,并进行可视化。t-SNE是由SNE发展而来的一种算法,SNE是通过变换将高维中的数据点映射到低维概率分布上,SNE将高维和低维中的样本分布都看作高斯分布,而t-SNE在低维空间中用t分布来代替高斯分布,使用厚尾分布t分布可以让距离大的簇之间距离拉大,可视化效果更好。图3.1信用卡五级分类t-SNE可视化图图3.1是利用Python中manifold包中的TSNE函数对信用卡五级分类数据做降维处理,然后用降维后的二维数据在平面上绘制散点图得到。图中五级分类用不同颜色表示,其中紫色表示的正常级别最多,其次是关注级别,这两类在图中的分布位置比较接近,分布在图中下方的是次级、可疑、损失三类。可视化结果显示属于正常和关注级别的客户特征较为相似,属于次级类的客户相对比较独立,容易区分,而属于可疑和损失类的客户特征比较相似,相对难区分。18


本文编号:2904280

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/2904280.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d473d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com