基于遗传XGBoost模型的个人网贷信用评估研究
发布时间:2023-01-30 12:24
随着移动互联的快速发展,各行各业均依靠“互联网+”的理念积极与其相融合迸发出新的创造力,其中互联网金融主流发展模式之一的P2P网贷行业依靠互联网金融的高效性与普惠性进入了高速发展的阶段。但由于P2P行业属于新兴行业,从业门槛低,从业素质稂莠不齐,由于信息不对称导致无法有效评估借款人信用水平而产生的信用风险在平台端快速聚集,久而久之P2P行业必然产生逆向选择,即为了降低风险缩减业务量,导致P2P市场萎缩,互联网金融发展停滞。基于此背景,本文以网贷违约用户为研究对象,利用银联大数据商务平台提供的有关借款人各方面特征的数据集,通过现代统计技术与数据挖掘技术,对个人互联网贷款信用评估问题进行研究,本文研究主要分为四部分:第一,查阅文献对互联网金融这一概念进行界定,从而引出本文所研究的P2P(Peer to Peer)网贷模式;第二,为了选取信用评估变量具有科学性以及扎实的理论基础,查阅信用评估相关文献,在前人研究的基础上选取并改进适用于互联网金融的有效信用评估变量;第三,通过对XGBoost模型理论进行梳理,构建基于遗传算法与XGBoost算法相结合的遗传XGBoost信用评估模型;第四,与传...
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景
1.2 研究意义
1.2.1 实践意义
1.2.2 理论意义
1.3 研究内容及思路
1.3.1 研究内容
1.3.2 研究思路
1.4 研究方法与创新及不足
第2章 相关概念界定及文献综述
2.1 互联网金融
2.2 互联网金融发展模式
2.2.1 P2P网贷风险
2.2.2 P2P网贷信用违约类型
2.3 文献综述
2.3.1 变量选取
2.3.2 模型选取
2.3.3 文献综述简评
第3章 个人网贷信用评估方法研究
3.1 XGBoost
3.2 逻辑回归
3.3 支持向量机(Support Vector Machine)
3.4 遗传算法
3.5 模型评估指标
3.5.1 混淆矩阵
3.5.2 ROC(Receiver Operating Characteristic)曲线
第4章 个人网贷信用评估的实证分析
4.1 数据描述
4.2 数据预处理
4.2.1 缺失值处理
4.2.2 异常值处理
4.2.3 独热编码(One-hot Encoding)
4.2.4 标准化与过采样(Over Sampling)
4.3 特征(变量)衍生
4.4 特征(变量)选取
4.4.1 包裹式选取
4.4.2 过滤式选取
4.5 信用评估模型构建
4.6 XGBoost模型参数优化
4.7 模型的评估与分析
第5章 遗传XGBoost模型与其他模型预测效果比较
5.1 与逻辑分类模型比较
5.2 与SVM分类模型比较
第6章 结论与展望
6.1 结论
6.2 展望
参考文献
致谢
【参考文献】:
期刊论文
[1]我国互联网金融发展的问题与对策[J]. 王励宁. 经贸实践. 2018(24)
[2]我国金融监管框架改革的若干思考[J]. 孙杰. 中国集体经济. 2018(36)
[3]我国小微企业通过互联网融资的风险研究——以P2P网络借贷平台为例[J]. 安曌婧. 科技经济导刊. 2018(31)
[4]动态异质集成信用评分模型在P2P网络借贷中的应用[J]. 刘传哲,马达亮,夏雨霏. 金融发展研究. 2018(09)
[5]一种改进过采样算法在类别不平衡信用评分中的应用[J]. 邵良杉,周玉. 计算机应用研究. 2019(06)
[6]金融创新、金融科技与互联网金融征信[J]. 刘桂荣. 征信. 2018(02)
[7]基于生存分析的P2P网络借贷违约风险影响因素研究[J]. 李思瑶,王积田,柳立超. 经济体制改革. 2016(06)
[8]中美P2P网络借贷平台模式比较分析[J]. 王铁山,康云鹏,潘昱璇. 西安邮电大学学报. 2016(05)
[9]信用评分卡体系的发展及应用[J]. 李延东,郑小娟. 青海金融. 2016(06)
[10]基于决策树的P2P网贷信用风险评价[J]. 孙同阳,谢朝阳. 商业经济研究. 2015(02)
博士论文
[1]我国P2P网络借贷的风险与监管研究[D]. 刘绘.天津财经大学 2015
[2]基于非平行超平面支持向量机的分类问题研究[D]. 王震.吉林大学 2014
[3]我国第三方支付发展研究[D]. 徐显峰.西南财经大学 2013
硕士论文
[1]信用评估在商业银行信用卡风险管理中的应用研究[D]. 孙珂.山东大学 2018
[2]信用评分卡的建立与应用[D]. 杨静.天津商业大学 2018
[3]P2P网贷平台的借款人信用评估研究[D]. 朱文倩.北京交通大学 2017
[4]基于AUC的分类器性能评估问题研究[D]. 蒋帅.吉林大学 2016
[5]基于用户互联网行为数据的个人征信评估体系建设分析[D]. 王冠.北京交通大学 2015
[6]基于P2P网贷平台特点的信用体系实证研究[D]. 段昊.北京邮电大学 2015
本文编号:3733072
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景
1.2 研究意义
1.2.1 实践意义
1.2.2 理论意义
1.3 研究内容及思路
1.3.1 研究内容
1.3.2 研究思路
1.4 研究方法与创新及不足
第2章 相关概念界定及文献综述
2.1 互联网金融
2.2 互联网金融发展模式
2.2.1 P2P网贷风险
2.2.2 P2P网贷信用违约类型
2.3 文献综述
2.3.1 变量选取
2.3.2 模型选取
2.3.3 文献综述简评
第3章 个人网贷信用评估方法研究
3.1 XGBoost
3.2 逻辑回归
3.3 支持向量机(Support Vector Machine)
3.4 遗传算法
3.5 模型评估指标
3.5.1 混淆矩阵
3.5.2 ROC(Receiver Operating Characteristic)曲线
第4章 个人网贷信用评估的实证分析
4.1 数据描述
4.2 数据预处理
4.2.1 缺失值处理
4.2.2 异常值处理
4.2.3 独热编码(One-hot Encoding)
4.2.4 标准化与过采样(Over Sampling)
4.3 特征(变量)衍生
4.4 特征(变量)选取
4.4.1 包裹式选取
4.4.2 过滤式选取
4.5 信用评估模型构建
4.6 XGBoost模型参数优化
4.7 模型的评估与分析
第5章 遗传XGBoost模型与其他模型预测效果比较
5.1 与逻辑分类模型比较
5.2 与SVM分类模型比较
第6章 结论与展望
6.1 结论
6.2 展望
参考文献
致谢
【参考文献】:
期刊论文
[1]我国互联网金融发展的问题与对策[J]. 王励宁. 经贸实践. 2018(24)
[2]我国金融监管框架改革的若干思考[J]. 孙杰. 中国集体经济. 2018(36)
[3]我国小微企业通过互联网融资的风险研究——以P2P网络借贷平台为例[J]. 安曌婧. 科技经济导刊. 2018(31)
[4]动态异质集成信用评分模型在P2P网络借贷中的应用[J]. 刘传哲,马达亮,夏雨霏. 金融发展研究. 2018(09)
[5]一种改进过采样算法在类别不平衡信用评分中的应用[J]. 邵良杉,周玉. 计算机应用研究. 2019(06)
[6]金融创新、金融科技与互联网金融征信[J]. 刘桂荣. 征信. 2018(02)
[7]基于生存分析的P2P网络借贷违约风险影响因素研究[J]. 李思瑶,王积田,柳立超. 经济体制改革. 2016(06)
[8]中美P2P网络借贷平台模式比较分析[J]. 王铁山,康云鹏,潘昱璇. 西安邮电大学学报. 2016(05)
[9]信用评分卡体系的发展及应用[J]. 李延东,郑小娟. 青海金融. 2016(06)
[10]基于决策树的P2P网贷信用风险评价[J]. 孙同阳,谢朝阳. 商业经济研究. 2015(02)
博士论文
[1]我国P2P网络借贷的风险与监管研究[D]. 刘绘.天津财经大学 2015
[2]基于非平行超平面支持向量机的分类问题研究[D]. 王震.吉林大学 2014
[3]我国第三方支付发展研究[D]. 徐显峰.西南财经大学 2013
硕士论文
[1]信用评估在商业银行信用卡风险管理中的应用研究[D]. 孙珂.山东大学 2018
[2]信用评分卡的建立与应用[D]. 杨静.天津商业大学 2018
[3]P2P网贷平台的借款人信用评估研究[D]. 朱文倩.北京交通大学 2017
[4]基于AUC的分类器性能评估问题研究[D]. 蒋帅.吉林大学 2016
[5]基于用户互联网行为数据的个人征信评估体系建设分析[D]. 王冠.北京交通大学 2015
[6]基于P2P网贷平台特点的信用体系实证研究[D]. 段昊.北京邮电大学 2015
本文编号:3733072
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3733072.html