数据挖掘模型在个人信贷风控中的应用
发布时间:2021-04-27 18:03
近年来,随着我国经济的快速发展,居民收入水平的提高,越来越多的人们开始习惯于提前消费,促进了我国个人信贷业务市场的快速增长。但是,发展的过程中许多问题也逐渐显现。一是传统银行的审查机制过紧,不仅会使银行的工作成本大幅增加,间接地提高贷款利率,还容易使其错失优质的客户,影响银行的收益;二是新兴网贷平台的审查机制过松,使借贷双方处于信息不对称的地位,导致了许多客户信用违约、平台携款跑路等影响恶劣的事件,对我国信贷市场的发展产生了十分不良的影响,同时对信贷业务的风险控制提出了严峻挑战。这两大问题背后的根源在于放贷一方对客户的信用水平不能做出准确的判断,以致无法做出正确的放贷决策。数据挖掘是分析海量数据的一种手段,通过各种模型的训练过程,可以发现数据中隐藏的、不易察觉的关联关系和因果规律。在信贷风控领域,经过多年的市场发展,行业内已经积累了大量的客户贷款时产生的信用数据,这些数据不仅本身蕴藏着巨大的可分析价值,而且由于以上信贷市场问题的存在,分析这些数据并找出客户信用水平的规律变得十分必要和紧迫。通过数据挖掘模型的应用,人们能发现客户历史贷款数据中各变量间的关系,从而为判断客户的信用水平提供帮...
【文章来源】:广西师范大学广西壮族自治区
【文章页数】:49 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景及意义
1.2 文献综述
1.2.1 个体模型
1.2.2 集成模型
1.3 本文结构及创新点
1.3.1 本文结构
1.3.2 本文创新点
第2章 相关概念和研究方法
2.1 变量选择与降维
2.1.1 变量选择
2.1.2 降维技术
2.2 个体模型介绍
2.2.1 K近邻
2.2.2 逻辑回归
2.2.3 决策树
2.2.4 支持向量机
2.3 集成模型介绍
2.3.1 Bagging
2.3.2 Boosting
2.3.3 Stacking
2.4 模型评价指标
2.4.1 F1 度量
2.4.2 交叉验证法
第3章 个人信贷风控的变量选择
3.1 数据来源
3.2 利用过滤式方法进行变量选择
3.2.1 剔除无利用价值的变量
3.2.2 根据信贷相关知识选择变量
3.2.3 利用GBDT法选择变量
3.3 数据变换
3.3.1 定性变量定量化
3.3.2 填补数据缺失值
3.3.3 数据标准化
3.4 数据降维
3.5 类别不平衡处理
第4章 数据挖掘模型在个人信贷风控中的实证分析
4.1 个体模型实证
4.1.1 K近邻
4.1.2 逻辑回归
4.1.3 决策树
4.1.4 支持向量机
4.2 Stacking集成模型的建立
4.2.1 生成次级训练集
4.2.2 次级模型训练
4.2.3 Stacking集成模型的建立
4.3 Stacking集成模型的应用
第5章 总结
5.1 本文总结
5.2 研究不足
参考文献
附录
致谢
【参考文献】:
期刊论文
[1]基于Lasso-logistic模型的个人信用风险预警方法[J]. 方匡南,章贵军,张惠颖. 数量经济技术经济研究. 2014(02)
[2]个人信用评估组合模型的构建——基于决策树—神经网络的研究[J]. 杨胜刚,朱琦,成程. 金融论坛. 2013(02)
硕士论文
[1]消费金融公司个人信用评价方法研究[D]. 张秋月.云南财经大学 2018
[2]多分类器融合算法的研究及其在信贷风控中的应用[D]. 陈羿螢.吉林大学 2018
[3]基于改进PSO-BP神经网络的个人信用评价模型及算法研究[D]. 蒋维.电子科技大学 2018
[4]逻辑回归模型在小额信贷企业中风控环节的应用研究[D]. 刘哲.首都经济贸易大学 2018
[5]基于BP神经网络对信贷客户逾期的分析与预测[D]. 孙小那.大连理工大学 2018
[6]基于逻辑回归的个人信用评分模型的研究[D]. 金香.东北财经大学 2016
[7]决策树算法在P2P网贷借款信用风险评估中的应用研究[D]. 刘艺.湖南大学 2016
本文编号:3163916
【文章来源】:广西师范大学广西壮族自治区
【文章页数】:49 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景及意义
1.2 文献综述
1.2.1 个体模型
1.2.2 集成模型
1.3 本文结构及创新点
1.3.1 本文结构
1.3.2 本文创新点
第2章 相关概念和研究方法
2.1 变量选择与降维
2.1.1 变量选择
2.1.2 降维技术
2.2 个体模型介绍
2.2.1 K近邻
2.2.2 逻辑回归
2.2.3 决策树
2.2.4 支持向量机
2.3 集成模型介绍
2.3.1 Bagging
2.3.2 Boosting
2.3.3 Stacking
2.4 模型评价指标
2.4.1 F1 度量
2.4.2 交叉验证法
第3章 个人信贷风控的变量选择
3.1 数据来源
3.2 利用过滤式方法进行变量选择
3.2.1 剔除无利用价值的变量
3.2.2 根据信贷相关知识选择变量
3.2.3 利用GBDT法选择变量
3.3 数据变换
3.3.1 定性变量定量化
3.3.2 填补数据缺失值
3.3.3 数据标准化
3.4 数据降维
3.5 类别不平衡处理
第4章 数据挖掘模型在个人信贷风控中的实证分析
4.1 个体模型实证
4.1.1 K近邻
4.1.2 逻辑回归
4.1.3 决策树
4.1.4 支持向量机
4.2 Stacking集成模型的建立
4.2.1 生成次级训练集
4.2.2 次级模型训练
4.2.3 Stacking集成模型的建立
4.3 Stacking集成模型的应用
第5章 总结
5.1 本文总结
5.2 研究不足
参考文献
附录
致谢
【参考文献】:
期刊论文
[1]基于Lasso-logistic模型的个人信用风险预警方法[J]. 方匡南,章贵军,张惠颖. 数量经济技术经济研究. 2014(02)
[2]个人信用评估组合模型的构建——基于决策树—神经网络的研究[J]. 杨胜刚,朱琦,成程. 金融论坛. 2013(02)
硕士论文
[1]消费金融公司个人信用评价方法研究[D]. 张秋月.云南财经大学 2018
[2]多分类器融合算法的研究及其在信贷风控中的应用[D]. 陈羿螢.吉林大学 2018
[3]基于改进PSO-BP神经网络的个人信用评价模型及算法研究[D]. 蒋维.电子科技大学 2018
[4]逻辑回归模型在小额信贷企业中风控环节的应用研究[D]. 刘哲.首都经济贸易大学 2018
[5]基于BP神经网络对信贷客户逾期的分析与预测[D]. 孙小那.大连理工大学 2018
[6]基于逻辑回归的个人信用评分模型的研究[D]. 金香.东北财经大学 2016
[7]决策树算法在P2P网贷借款信用风险评估中的应用研究[D]. 刘艺.湖南大学 2016
本文编号:3163916
本文链接:https://www.wllwen.com/jingjilunwen/touziyanjiulunwen/3163916.html