当前位置:主页 > 经济论文 > 银行论文 >

基于数据挖掘技术的信用评分卡模型研究

发布时间:2021-10-05 00:18
  近年来,随着互联网金融中的个人消费信贷领域的飞快发展,如何根据客户的特征行为数据对客户的行为进行分析,优化客户分类,更科学地为管理者提供数据支持,更有效地进行风险管理,具有非常重要的现实意义。为了有效直观地评估风险,引入信用评分卡模型。本文主要通过如下五个部分来进行分析:第一部分主要是介绍选题的研究背景及意义、国内外研究概况,第二部分是对数据挖掘技术进行了简单的介绍,以及介绍评分卡的发展历程及分类。第三部分主要是对数据进行预处理,包括:缺失值处理、异常值处理、数据探索、特征处理、类不平衡处理。第四部分是构建模型,本文选用了逻辑回归、决策树和支持向量机三种方法进行建模,利用准确率、召回率、F1值和AUC值对所建的模型进行评估,从预测能力和解释能力两个方面综合考虑,选择用逻辑回归方法建立信用评分卡模型。第五部分是对本文所做工作进行总结与展望。结果表明,在所有原始特征中,关于历史逾期行为的特征都用于最后的建模,说明历史逾期行为对用户是否违约具有显著性的影响。在选择模型时,综合整体评估,预测能力方面:决策树的AUC值是最高的,达到0.8373,逻辑回归也达到了0.8309,相差不大;解释能力方... 

【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校

【文章页数】:51 页

【学位级别】:硕士

【部分图文】:

基于数据挖掘技术的信用评分卡模型研究


age年龄箱形图

负债率,额度,箱形,可用


12图 3-2 percentage(可用额度比值)及 DebtRatio(负债率)箱形图于 percentage(可用额度比值)及 DebtRatio(负债率)而言,这两是百分比,因此删除大于 1 的值。

箱形,离群值,变量,单变量分析


图 3-3 30-59、60-89、90-三个变量箱形图三个变量都有离群值,查看各个特征离群值的数量,它们离群值的数量都比则把这些离群值都删除。其他变量离群值不是很明显,暂时不做处理。 数据探索单变量分析(年龄)变量

【参考文献】:
期刊论文
[1]信用评分模型比较综述——基于传统方法与数据挖掘的对比[J]. 何珊,刘振东,马小林.  征信. 2019(02)
[2]基于XGBOOST的用户信用评分建模[J]. 韩修龙.  电脑知识与技术. 2018(05)
[3]数据挖掘技术综述[J]. 邹祎.  信息通信. 2016(12)
[4]信用评分卡体系的发展及应用[J]. 李延东,郑小娟.  青海金融. 2016(06)
[5]数据挖掘技术的综述[J]. 王雅轩,顼聪.  电子技术与软件工程. 2015(08)
[6]信用评分卡综述[J]. 黎玉华.  黑龙江科技信息. 2010(17)
[7]基于GP+BP的信用评估模型研究[J]. 徐娟,胡学钢.  合肥工业大学学报(自然科学版). 2010(04)
[8]个人信用卡信用风险评价体系与模型研究[J]. 迟国泰,许文,孙秀峰.  同济大学学报(自然科学版). 2006(04)
[9]我国上市公司财务风险预警模型的构建及实证分析[J]. 郑茂.  金融论坛. 2003(10)
[10]组合预测在商业银行信用风险评估中的应用[J]. 王春峰,万海晖,张维.  管理工程学报. 1999(01)

硕士论文
[1]信用评分卡的建立与应用[D]. 杨静.天津商业大学 2018
[2]基于数据挖掘技术的信用评分卡模型[D]. 倪显情.苏州大学 2017
[3]基于证据权重逻辑回归模型的P2P公司信用风险评估[D]. 王金珠.南京航空航天大学 2016



本文编号:3418618

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/3418618.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d8e6b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com