基于Logistic回归的授信模型与参数更新研究
发布时间:2020-12-26 13:18
普惠金融是我国在“十三五”期间重要的战略决策部署。个人征信是普惠金融中的一个重要环节,随着互联网的快速发展,因个人征信问题而产生的坏账率逐年上升,如何准确的对个人授信进行评估变得尤为重要。本文积极响应国家和地区战略的号召,依托我们实验室承建的甘肃银行“三农”数字普惠金融服务平台,以甘肃省“三农”大数据为基础,利用大数据技术,对甘肃省农户个人征信问题展开了相关研究。首先,对甘肃银行提供的农户基础数据和银行历史业务数据进行包括缺失值、异常值处理在内的数据预处理工作,进而通过综合应用Pearson系数、Spearman系数、主成分分析(PCA)等方法,最终选取特征值大于1,累计贡献率大于80%的特征作为实验特征。其次,以选取的实验样本特征为基础,利用Logistic回归、决策树、K近邻、随机森林和支持向量机(SVM)方法分别建立授信模型,依据准确度、AUC、耗费时间等评估标准进行预测结果对比。对比发现,Logistic回归算法的综合效果最好。因此,我们采用Logistic回归算法进行农户授信额度的预测,在预授信额度的基础上,结合中国人民银行提供的征信报告,计算出农户的最终授信额度。最后,因为...
【文章来源】:西北师范大学甘肃省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
农户授信额度评估流程图
西北师范大学硕士学位论文16图2-1碎石图(3)计算主成分系数表2-10是因子载荷矩阵,因子载荷矩阵是分析各主成分的关键步骤,是用标准化后的主成分近似表示标准化原始变量的系数矩阵,表2-11是得到的主成分表达式系数矩阵。表2-10初始因子载荷矩阵1234567891011x1-0.020.12-0.02-0.06-0.62-0.40-0.05-0.23-0.070.08-0.13x20.020.04-0.010.090.16-0.100.350.61-0.130.15-0.33x30.340.88-0.10-0.160.120.000.020.01-0.03-0.01-0.01x40.340.88-0.10-0.160.11-0.010.01-0.01-0.01-0.010.01x50.230.10-0.040.590.18-0.20-0.18-0.14-0.02-0.02-0.13x60.120.170.020.260.090.100.30-0.510.120.22-0.12x70.260.13-0.090.460.05-0.23-0.090.270.00-0.14-0.17x8-0.17-0.550.040.250.060.05-0.03-0.010.000.020.04x90.070.09-0.030.230.04-0.34-0.16-0.010.240.150.49x100.06-0.01-0.020.01-0.070.07-0.090.030.790.23-0.33x11-0.05-0.100.110.040.41-0.040.58-0.310.060.120.13x120.06-0.010.010.490.39-0.12-0.16-0.01-0.120.01-0.29x130.07-0.090.030.100.260.25-0.14-0.30-0.270.02-0.01x140.04-0.03-0.010.050.240.170.080.080.38-0.610.20x150.180.17-0.070.38-0.420.34-0.04-0.10-0.12-0.070.01x160.120.14-0.030.120.100.53-0.440.110.050.070.15x170.030.020.000.030.100.13-0.170.15-0.050.660.20x180.080.10-0.050.41-0.26-0.050.07-0.04-0.03-0.190.06x190.040.08-0.040.25-0.240.390.440.28-0.080.090.17x200.87-0.38-0.13-0.13-0.03-0.020.040.01-0.07-0.010.02x210.170.090.930.01-0.050.000.000.040.02-0.010.00
第3章授信模型更新25第3章授信模型更新普惠金融平台的核心是建立针对农户的信用评估模型,在农户通过手机银行申请贷款时能自动计算其信用额度,减少客户经理人为干预,实现全线上授信的最终目标。但是随着农户数据量的增多,原有模型是否依旧适合现有业务的发展需求?基于以上问题,本文提出基于原模型的参数更新,希望能够解决随着业务的开展,模型也能够随之自动更新的问题。具体流程图如图3-1所示。图3-1模型更新流程图3.1模型更新条件在本文中,模型训练更新的触发条件有两个:数据增量达到10万条和银行贷款坏账率(也称不良贷款率)达到1.7%。对于数据增量要求达到10万条是从银行实际业务开展情况出发,为了保证农户数据的数据量充足,可以较为全面的反映农户整体真实情况。
【参考文献】:
期刊论文
[1]逻辑回归中的批量梯度下降算法并行化研究[J]. 李姚舜,刘黎志. 武汉工程大学学报. 2019(05)
[2]农户信誉特征、还款意愿传递与农户信贷可得——基于信号传递博弈的理论分析和实证检验[J]. 王性玉,任乐,赵辉,姚唯一. 管理评论. 2019(05)
[3]大数据在我国个人征信领域的问题探索[J]. 丁洁. 价值工程. 2018(30)
[4]阿里巴巴和京东个人信用评分体系差异性研究[J]. 刘奕雄. 金融经济. 2017(14)
[5]如何评估借款人还款意愿?[J]. 孙自通. 首席财务官. 2015(12)
[6]个人信用评分模型的发展及优化算法分析[J]. 姜明辉,许佩,任潇,车凯. 哈尔滨工业大学学报. 2015(05)
[7]基于Logit与SVM的银行业信用风险预警模型研究[J]. 张奇,胡蓝艺,王珏. 系统工程理论与实践. 2015(07)
[8]基于Logistic模型的商业银行个人消费信贷风险评估研究[J]. 张国政,陈维煌,刘呈辉. 金融理论与实践. 2015(03)
[9]基于混淆矩阵和集成学习的分类方法研究[J]. 孔英会,景美丽. 计算机工程与科学. 2012(06)
[10]基于基因表达式编程的信用评估模型挖掘方法[J]. 吴江,唐常杰,段磊,李太勇. 计算机应用. 2007(04)
博士论文
[1]基于实时监测数据挖掘的风电机组故障预警方法研究[D]. 刘帅.华北电力大学(北京) 2019
[2]个人信用风险评估理论与方法的拓展研究[D]. 帅理.电子科技大学 2015
[3]基于客户信用评级的商业银行信贷管理研究[D]. 刘振华.湖南大学 2015
[4]供应链金融背景下银行授信决策研究[D]. 汤国生.华南理工大学 2014
硕士论文
[1]个人消费信贷风险的识别和预警[D]. 甘蔷.浙江大学 2019
[2]基于Logistic回归和Probit回归的个人信用评估研究[D]. 宋燕.广西师范大学 2019
[3]基于GBDT和LR融合的个人信用评估模型的研究与应用[D]. 孟硕.北京工业大学 2018
[4]基于Logistic回归分析的返贫预测模型研究[D]. 田昆.西北师范大学 2018
[5]基于Logistic模型的信用风险评估[D]. 李杰.华南理工大学 2017
[6]大数据下的个人征信体系研究[D]. 赵克非.浙江大学 2017
[7]基于Logistic回归模型的P2P网贷平台借款人信用风险评估[D]. 王梦佳.北京外国语大学 2015
[8]基于用户互联网行为数据的个人征信评估体系建设分析[D]. 王冠.北京交通大学 2015
[9]个人信用评分组合模型研究[D]. 张飞.电子科技大学 2015
[10]基于SVM的个人信用评分系统设计[D]. 陈伟松.上海交通大学 2014
本文编号:2939775
【文章来源】:西北师范大学甘肃省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
农户授信额度评估流程图
西北师范大学硕士学位论文16图2-1碎石图(3)计算主成分系数表2-10是因子载荷矩阵,因子载荷矩阵是分析各主成分的关键步骤,是用标准化后的主成分近似表示标准化原始变量的系数矩阵,表2-11是得到的主成分表达式系数矩阵。表2-10初始因子载荷矩阵1234567891011x1-0.020.12-0.02-0.06-0.62-0.40-0.05-0.23-0.070.08-0.13x20.020.04-0.010.090.16-0.100.350.61-0.130.15-0.33x30.340.88-0.10-0.160.120.000.020.01-0.03-0.01-0.01x40.340.88-0.10-0.160.11-0.010.01-0.01-0.01-0.010.01x50.230.10-0.040.590.18-0.20-0.18-0.14-0.02-0.02-0.13x60.120.170.020.260.090.100.30-0.510.120.22-0.12x70.260.13-0.090.460.05-0.23-0.090.270.00-0.14-0.17x8-0.17-0.550.040.250.060.05-0.03-0.010.000.020.04x90.070.09-0.030.230.04-0.34-0.16-0.010.240.150.49x100.06-0.01-0.020.01-0.070.07-0.090.030.790.23-0.33x11-0.05-0.100.110.040.41-0.040.58-0.310.060.120.13x120.06-0.010.010.490.39-0.12-0.16-0.01-0.120.01-0.29x130.07-0.090.030.100.260.25-0.14-0.30-0.270.02-0.01x140.04-0.03-0.010.050.240.170.080.080.38-0.610.20x150.180.17-0.070.38-0.420.34-0.04-0.10-0.12-0.070.01x160.120.14-0.030.120.100.53-0.440.110.050.070.15x170.030.020.000.030.100.13-0.170.15-0.050.660.20x180.080.10-0.050.41-0.26-0.050.07-0.04-0.03-0.190.06x190.040.08-0.040.25-0.240.390.440.28-0.080.090.17x200.87-0.38-0.13-0.13-0.03-0.020.040.01-0.07-0.010.02x210.170.090.930.01-0.050.000.000.040.02-0.010.00
第3章授信模型更新25第3章授信模型更新普惠金融平台的核心是建立针对农户的信用评估模型,在农户通过手机银行申请贷款时能自动计算其信用额度,减少客户经理人为干预,实现全线上授信的最终目标。但是随着农户数据量的增多,原有模型是否依旧适合现有业务的发展需求?基于以上问题,本文提出基于原模型的参数更新,希望能够解决随着业务的开展,模型也能够随之自动更新的问题。具体流程图如图3-1所示。图3-1模型更新流程图3.1模型更新条件在本文中,模型训练更新的触发条件有两个:数据增量达到10万条和银行贷款坏账率(也称不良贷款率)达到1.7%。对于数据增量要求达到10万条是从银行实际业务开展情况出发,为了保证农户数据的数据量充足,可以较为全面的反映农户整体真实情况。
【参考文献】:
期刊论文
[1]逻辑回归中的批量梯度下降算法并行化研究[J]. 李姚舜,刘黎志. 武汉工程大学学报. 2019(05)
[2]农户信誉特征、还款意愿传递与农户信贷可得——基于信号传递博弈的理论分析和实证检验[J]. 王性玉,任乐,赵辉,姚唯一. 管理评论. 2019(05)
[3]大数据在我国个人征信领域的问题探索[J]. 丁洁. 价值工程. 2018(30)
[4]阿里巴巴和京东个人信用评分体系差异性研究[J]. 刘奕雄. 金融经济. 2017(14)
[5]如何评估借款人还款意愿?[J]. 孙自通. 首席财务官. 2015(12)
[6]个人信用评分模型的发展及优化算法分析[J]. 姜明辉,许佩,任潇,车凯. 哈尔滨工业大学学报. 2015(05)
[7]基于Logit与SVM的银行业信用风险预警模型研究[J]. 张奇,胡蓝艺,王珏. 系统工程理论与实践. 2015(07)
[8]基于Logistic模型的商业银行个人消费信贷风险评估研究[J]. 张国政,陈维煌,刘呈辉. 金融理论与实践. 2015(03)
[9]基于混淆矩阵和集成学习的分类方法研究[J]. 孔英会,景美丽. 计算机工程与科学. 2012(06)
[10]基于基因表达式编程的信用评估模型挖掘方法[J]. 吴江,唐常杰,段磊,李太勇. 计算机应用. 2007(04)
博士论文
[1]基于实时监测数据挖掘的风电机组故障预警方法研究[D]. 刘帅.华北电力大学(北京) 2019
[2]个人信用风险评估理论与方法的拓展研究[D]. 帅理.电子科技大学 2015
[3]基于客户信用评级的商业银行信贷管理研究[D]. 刘振华.湖南大学 2015
[4]供应链金融背景下银行授信决策研究[D]. 汤国生.华南理工大学 2014
硕士论文
[1]个人消费信贷风险的识别和预警[D]. 甘蔷.浙江大学 2019
[2]基于Logistic回归和Probit回归的个人信用评估研究[D]. 宋燕.广西师范大学 2019
[3]基于GBDT和LR融合的个人信用评估模型的研究与应用[D]. 孟硕.北京工业大学 2018
[4]基于Logistic回归分析的返贫预测模型研究[D]. 田昆.西北师范大学 2018
[5]基于Logistic模型的信用风险评估[D]. 李杰.华南理工大学 2017
[6]大数据下的个人征信体系研究[D]. 赵克非.浙江大学 2017
[7]基于Logistic回归模型的P2P网贷平台借款人信用风险评估[D]. 王梦佳.北京外国语大学 2015
[8]基于用户互联网行为数据的个人征信评估体系建设分析[D]. 王冠.北京交通大学 2015
[9]个人信用评分组合模型研究[D]. 张飞.电子科技大学 2015
[10]基于SVM的个人信用评分系统设计[D]. 陈伟松.上海交通大学 2014
本文编号:2939775
本文链接:https://www.wllwen.com/guanlilunwen/bankxd/2939775.html