个人信用评估模型实证分析
发布时间:2021-11-20 21:15
近年来,随着网络通信和互联网的逐渐发达和普及,互联网金融行业在国内正在蓬勃兴起,互联网金融贷款也逐渐成为一种趋势。自2007年网络贷款进入中国以来,这种信贷交易模式逐渐发展并得到流行,到目前已经在互联网金融行业中占据重要地位。但与此同时,这种以信用无抵押贷款模式的流行,信用风险也随之而来,所以这就促使贷款平台需要更加严格审核申请用户的信用信息,但是,由于国内信用体系还不够完善,以及针对信用贷款无抵押模式的风险控制研究还不够深入,导致很多贷款平台的逾期客户和坏账率增加,以致于最终面临倒闭的风险。随着大数据技术的成熟,网络贷款行业也逐渐选择通过大数据挖掘技术对用户数据进行深入分析,从中找到能够帮助筛选优质客户的数据规律,除了能够利用业务经验之外,也能够利用数据模型进行科学判断客户资质,从而提高盈利,减少行业损失。本文主要通过Lending Club P2P贷款平台获得原始数据以进行后续模型的搭建,由于数据质量较差,出现格式混乱或者缺失值及异常值,且原始数据中存在非平衡问题,因此在建立数据模型前,需要对原始数据进行预处理,本文通过SMOTE算法进行少数类样本的增加,并对连续性属性和取值较多的...
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:43 页
【学位级别】:硕士
【部分图文】:
逻辑回归函数分布
重庆大学硕士学位论文 3 理论概述③ 生成的 K颗决策树,并进行完整不剪枝生长。④ 将训练好的 K 颗决策树进行合并,组成一个随机森林,然后对新的样本集进行分类,利用多颗树的投票来判断样本的最终分类结果。3.3.1 决策树决策树算法是通过一系列的判别规则对样本数据进行分类的过程,也是较为常用且简单基本的分类算法,最优决策树的生成过程中主要包含三个方面:特征的选择、决策树的生成、决策树的剪枝处理。常用的决策树算法包括有 ID3、C4.5、CART分类树三种,这三种算法的区别具体表现为以下流程:
学位论文 4 数据4 数据的收集与处理介绍与描述用数据来源于美国 lending club 网络贷款公司公布数据,总包含 25 个变量,其中有一个自造衍生变量为月还收入 作为目标变量。在原始数据集中,存在不同的贷款期限,须要在统一的期限内,并且不宜过长,所以选取贷款期数总体样本集,总计 23411 条样本。的描述性统计始数据集,利用 R 统计软件进行简单的描述统计,对总体可视化统计如下图 4.1:
【参考文献】:
期刊论文
[1]基于Logistic的P2P网贷借款人信用风险评估研究[J]. 徐慧婷. 中国石油大学学报(社会科学版). 2017(06)
[2]一种基于Boosting的集成学习算法在银行个人信用评级中的应用[J]. 陈力,黄艳莹,游德创. 价值工程. 2017(18)
[3]层次分析法和支持向量机在个人信用评估中的应用[J]. 许艳秋,潘美芹. 中国管理科学. 2016(S1)
[4]《网络借贷信息中介机构业务活动管理暂行办法》(征求意见稿)解读[J]. 张书红. 知识经济. 2016(06)
[5]P2P借贷平台风险分析[J]. 赵彬丞,张嘉卿,赖俊明. 当代经济. 2016(04)
[6]我国P2P网络信贷中个人信用评级研究[J]. 张墨. 经济视角(上旬刊). 2015(03)
[7]基于随机森林的个人信用评估模型研究及实证分析[J]. 萧超武,蔡文学,黄晓宇,陈康. 管理现代化. 2014(06)
[8]德国IPC公司微贷技术在我国经济欠发达地区的运用——以桂林辖区为例[J]. 龙新庭,王晓华. 区域金融研究. 2013(10)
[9]美国个人信用评分体系研究及启示[J]. 白云峰,毕强. 现代管理科学. 2010(12)
[10]基于分类树和支持向量机的个人信用评估方法[J]. 高莉. 内江师范学院学报. 2009(08)
硕士论文
[1]大数据时代的征信创新与发展研究[D]. 姜俊琳.浙江大学 2016
[2]P2P网络信贷行为及风险评估研究[D]. 杨薇薇.中国海洋大学 2014
[3]我国P2P网络信贷风险评估研究[D]. 刘峙廷.广西大学 2013
[4]个人信用评估模型研究[D]. 刘征.西南财经大学 2006
本文编号:3508107
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:43 页
【学位级别】:硕士
【部分图文】:
逻辑回归函数分布
重庆大学硕士学位论文 3 理论概述③ 生成的 K颗决策树,并进行完整不剪枝生长。④ 将训练好的 K 颗决策树进行合并,组成一个随机森林,然后对新的样本集进行分类,利用多颗树的投票来判断样本的最终分类结果。3.3.1 决策树决策树算法是通过一系列的判别规则对样本数据进行分类的过程,也是较为常用且简单基本的分类算法,最优决策树的生成过程中主要包含三个方面:特征的选择、决策树的生成、决策树的剪枝处理。常用的决策树算法包括有 ID3、C4.5、CART分类树三种,这三种算法的区别具体表现为以下流程:
学位论文 4 数据4 数据的收集与处理介绍与描述用数据来源于美国 lending club 网络贷款公司公布数据,总包含 25 个变量,其中有一个自造衍生变量为月还收入 作为目标变量。在原始数据集中,存在不同的贷款期限,须要在统一的期限内,并且不宜过长,所以选取贷款期数总体样本集,总计 23411 条样本。的描述性统计始数据集,利用 R 统计软件进行简单的描述统计,对总体可视化统计如下图 4.1:
【参考文献】:
期刊论文
[1]基于Logistic的P2P网贷借款人信用风险评估研究[J]. 徐慧婷. 中国石油大学学报(社会科学版). 2017(06)
[2]一种基于Boosting的集成学习算法在银行个人信用评级中的应用[J]. 陈力,黄艳莹,游德创. 价值工程. 2017(18)
[3]层次分析法和支持向量机在个人信用评估中的应用[J]. 许艳秋,潘美芹. 中国管理科学. 2016(S1)
[4]《网络借贷信息中介机构业务活动管理暂行办法》(征求意见稿)解读[J]. 张书红. 知识经济. 2016(06)
[5]P2P借贷平台风险分析[J]. 赵彬丞,张嘉卿,赖俊明. 当代经济. 2016(04)
[6]我国P2P网络信贷中个人信用评级研究[J]. 张墨. 经济视角(上旬刊). 2015(03)
[7]基于随机森林的个人信用评估模型研究及实证分析[J]. 萧超武,蔡文学,黄晓宇,陈康. 管理现代化. 2014(06)
[8]德国IPC公司微贷技术在我国经济欠发达地区的运用——以桂林辖区为例[J]. 龙新庭,王晓华. 区域金融研究. 2013(10)
[9]美国个人信用评分体系研究及启示[J]. 白云峰,毕强. 现代管理科学. 2010(12)
[10]基于分类树和支持向量机的个人信用评估方法[J]. 高莉. 内江师范学院学报. 2009(08)
硕士论文
[1]大数据时代的征信创新与发展研究[D]. 姜俊琳.浙江大学 2016
[2]P2P网络信贷行为及风险评估研究[D]. 杨薇薇.中国海洋大学 2014
[3]我国P2P网络信贷风险评估研究[D]. 刘峙廷.广西大学 2013
[4]个人信用评估模型研究[D]. 刘征.西南财经大学 2006
本文编号:3508107
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3508107.html