当前位置:主页 > 经济论文 > 国际贸易论文 >

基于Lasso-XGBoost模型的P2P网贷违约信用风险评估

发布时间:2020-07-05 18:30
【摘要】:随着网络技术的迅猛发展,金融与互联网的联系越来越紧密,全球的信贷模式也随之产生了极大的变化,由传统的金融机构产生信贷向互联网金融信贷发展,同时信贷平台对信用风险控制的要求也越来越高。因此通过建立信用风险分类模型对客户信用违约情况进行分类预测,对于P2P借贷平台和投资人来说至关重要。本文首先介绍了P2P网贷信用风险的相关发展研究,对可用来进行信用风险评估的分类模型理论进行了阐述,选择Logistic回归、支持向量机两个单模型和随机森林、XGBoost两个集成模型对客户信用风险进行分类和预测。其次在实证阶段,本文对国外著名P2P借贷平台Lending Club的个人信贷数据进行分析研究,对该平台的信贷数据进行数据清洗,使用Lasso算法对清洗过后的数据进行特征筛选,利用欠采样方法对数据的不平衡性进行处理。随后建立Logistic回归、支持向量机、随机森林、XGBoost四个分类预测对比模型。最后本文使用模型召回率、准确率、ROC曲线等相关验证指标对模型进行对比,结果表明,相比于单模型来说,集成模型的预测效果更好,其中XGBoost模型的表现最佳。本文将Lasso算法和XGBoost模型相结合,提出一种新的信用风险分类模型:Lasso-XGBoost。Lasso-XGBoost组合模型更加适用于信用风险评估,该模型可显著提高风险分类预测精度。
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F832.4;F724.6
【图文】:

数据缺失,兰州大学,硕士学位论文


数据缺失值检验

路径图,路径图,变量选择


第四章 实证分析4.1 Lasso 变量选择由于数据集中变量个数较多,如果未经过筛选建模会增加模型的复杂时也延长模型的训练时间,这样建立的模型既复杂也不经济,不符合现实因此本文在建模之前进行变量筛选,使用 Lasso 算法进行降维,选择变量因为数据集中有些数据较大,有些数据较小,为避免大数吃小数、不影响结果等情形的出现,在进行变量选择之前本文对连续型数据进行标理。R 语言有一个著名的广义线性模型弹性网 glmnet 包,可以用来处理归、Logistic 回归等多种回归模型,是一种有效的变量选择的方法。本文语言进行 Lasso 回归,回归路径如图 4-1 所示,该图展示了 Lasso 系数选的过程,图中顶部数字表示非零系数的个数,即所选择出的变量个数。从看出被选择出的变量远离坐标抽,未选出的变量靠近坐标抽,起到了压缩降维的作用。

【相似文献】

中国期刊全文数据库 前10条

1 孟杰;;企业信用风险评估方法综述[J];中国国际财经(中英文);2018年02期

2 杨扬;周一懋;周宗放;;基于文本大数据的企业信用风险评估[J];大数据;2017年01期

3 张益;;基于层次分析法的中小企业信用风险评估[J];商;2015年45期

4 杨平波;朱雅斯;;我国小额贷款公司信用风险评估研究述评[J];湖南商学院学报;2015年04期

5 ;博衍财富 信达天下 诚负所托[J];今日财富;2016年06期

6 沈军彩;徐继红;;神经网络的企业信用风险评估应用研究[J];计算机仿真;2012年03期

7 吕运福;;商业银行信用风险评估管理对策[J];学理论;2011年16期

8 符涛;刘正;张晋峰;;高科技企业的信用风险评估研究[J];经济视角(中旬);2011年09期

9 李甫英;商业银行信用风险评估实证[J];企业经济;2005年10期

10 柴彭颐,刘钻石;关于小型外贸企业信用风险评估指标体系的探讨[J];商业研究;2004年06期

中国重要会议论文全文数据库 前9条

1 刘睿;周宗放;;云理论在企业集团信用风险评估中的应用[A];“中国视角的风险分析和危机反应”——中国灾害防御协会风险分析专业委员会第四届年会论文集[C];2010年

2 陈林;周宗放;肖珉;;企业集团信用风险评估研究综述[A];第五届(2010)中国管理学年会——管理科学与工程分会场论文集[C];2010年

3 陈林;周宗放;;基于信度理论的新兴技术企业信用风险评估方法[A];中国灾害防御协会风险分析专业委员会第二届年会论文集(二)[C];2006年

4 张建同;丁烨;邱伟;;数据质押融资模式下的中小企业信用风险评估研究[A];第十二届(2017)中国管理学年会论文集[C];2017年

5 张目;周宗放;;基于多目标规划和支持向量机的企业信用评估模型[A];第三届贵州省自然科学优秀学术论文评选获奖论文集(2010年)[C];2010年

6 刘文蕊;张目;周宗放;;基于粗糙集和遗传算法的企业集团信用风险识别[A];“中国视角的风险分析和危机反应”——中国灾害防御协会风险分析专业委员会第四届年会论文集[C];2010年

7 周绮凤;林成德;;商业银行信用风险评估中多分类方法的比较[A];第二十四届中国控制会议论文集(下册)[C];2005年

8 帅理;赖辉;周宗放;;个人信用风险评估研究综述[A];Proceedings of the Third Symposium of Risk Analysis and Risk Management in Western China[C];2013年

9 邓宇翔;鲁炜;黄敏;;运用概率神经网络进行企业信用风险评估[A];2003年中国管理科学学术会议论文集[C];2003年

中国重要报纸全文数据库 前10条

1 本报记者 周松林;中证指数两项债市信用风险评估新指标发布[N];中国证券报;2017年

2 记者 祁豆豆;中证指数发布两项债市信用风险评估新指标[N];上海证券报;2017年

3 本报记者 于德良;用图计算做黑名单测试 京东金融准确率超90%[N];证券日报;2017年

4 记者 陈小三;日本信用风险评估工具登陆中国[N];国际商报;2006年

5 海 燕;AMS信用风险评估引入中国[N];中国商报;2006年

6 记者 卫容之;中国信用风险评估仍高居“A类”[N];国际金融报;2003年

7 程汲;地区信用风险评估应该推行[N];金融时报;2004年

8 北京航空航天大学经管学院 王娟;美国信用风险评估体系简介[N];金融时报;2002年

9 记者 潘清 王旺旺;应对违约风险困扰 信用债市场补信用甄别“短板”[N];经济参考报;2016年

10 德海;韩7家中小船企要“动手术”[N];中国船舶报;2009年

中国博士学位论文全文数据库 前10条

1 赵静娴;基于决策树的信用风险评估方法研究[D];天津大学;2009年

2 郭英见;基于信息融合的国有商业银行信用风险评估研究[D];哈尔滨工业大学;2010年

3 蒙震;中小企业信用风险评估及其对贷款定价的影响研究[D];对外经济贸易大学;2015年

4 高珊珊;农村消费信贷信用风险评估[D];中国矿业大学(北京);2010年

5 TRAN DUY VU NGOC LAN;基于神经网络模型的中国和越南上市商业银行信用风险评估研究[D];湖南大学;2012年

6 帅理;个人信用风险评估理论与方法的拓展研究[D];电子科技大学;2015年

7 祝由;供应链金融环境下中小企业信用风险评估研究[D];湖南大学;2017年

8 娄春伟;基于多目标决策与数据挖掘融合方法的主权信用风险评估研究[D];电子科技大学;2012年

9 肖珉;我国企业集团上市公司财务预警与信用风险评估研究[D];电子科技大学;2012年

10 张兰花;林权抵押贷款信用风险评估研究[D];福建农林大学;2010年

中国硕士学位论文全文数据库 前10条

1 任静;基于Lasso-XGBoost模型的P2P网贷违约信用风险评估[D];兰州大学;2019年

2 张宁;基于商业银行视角的中小企业不同融资模式信用风险评估[D];东北大学;2015年

3 孙晗;我国国有企业信用风险评估[D];南京理工大学;2018年

4 刘晶宇;基于Logistic回归模型的校园贷信用风险评估研究[D];湖南大学;2018年

5 周春亚;基于贝叶斯网络分类的P2P网络借贷信用风险评估研究[D];湖南大学;2018年

6 尤金;P2P网贷信用风险评估及博弈分析[D];兰州财经大学;2018年

7 王浩豫;商业银行信用风险评估研究[D];苏州大学;2018年

8 李青霞;基于KMV模型的苏州上市公司信用风险评估研究[D];苏州大学;2018年

9 陈春芳;S银行个人住房抵押贷款信用风险评估[D];南京航空航天大学;2018年

10 刘凡晖;基于Logistic-KMV模型的制造业上市公司信用风险评估研究[D];湖南大学;2018年



本文编号:2742977

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2742977.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户db2c0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com