当前位置:主页 > 经济论文 > 经济管理论文 >

面向高维数据的个人信贷风险评估方法

发布时间:2020-10-09 00:54
   随着电商平台分期付款方式和P2P信贷平台的不断推广,如何从海量的用户信贷数据中挖掘出潜在的用户模型并对未知用户进行信贷风险评估,以降低信贷业务的风险,已经成为研究的主流。针对现有方法无法高效处理高维度信贷数据的问题,使用一系列的数据预处理方法和基于Embedded思想的特征选择方法 XGBFS(XGBoost Feature Selection),以降低用户信贷数据维度并训练出XGBoost评估模型,最终实现用户信贷风险评估。实验表明,与现有的方法相比,该方法能够从高维的数据中选择出重要属性,并且分类器在精确率、召回率等方面具有较为突出的性能。
【部分图文】:

信贷风险,维数,个人,降维


面向高维数据的个人信贷风险评估方法主要包括以下过程:首先将训练数据集进行数据清洗、缺失值处理和数据归一化等预处理;再基于XGBFS对数据进行降维:最后通过XGBoost对降维后的数据进行用户信贷评估建模。具体流程如图1所示。3.1 数据预处理

流程图,数据预处理,流程,属性


现代信贷用户信息中除了属性高维外,还会存在多种类别的属性,如离散型、连续型、文本型等。如何对各种类别的属性进行科学的预处理是信贷风险评估的首要前提。针对不同类型的数据应当采取不同的处理方法:对于连续型属性,直接进行归一化处理。对于类别型属性,先进行类别编码,再进行归一化处理。对于离散型属性,先进行分段处理再进行归一化处理。对于文本型属性,先进行TF-IDF(Term Frequency-Inverse Document Frequency)提取特征,再通过LSA(Latent Semantic Analysis)[17]进行语义分析,将分析结果进行归一化处理。数据预处理的流程如图2所示。3.1.1 类别型属性

过程图,单词,文档,构造方法


目前典型的LSA空间的构造方法是基于奇异值分解(Singular Value Decomposition,SVD)的空间构造方法。如图3所示,通过对文档集的单词-文档矩阵的奇异值分解,可以提取出H个最大的奇异值和对应的左右奇异矩阵,并还原出和原来相似的单词-文档矩阵。3.1.4 缺失值处理

【相似文献】

相关期刊论文 前3条

1 佘朝兵;;Logistic回归在银行个人信贷风险评估上的应用研究[J];科技与创新;2018年19期

2 晏艳阳;金鹏;;个人信贷中信用风险识别的信号博弈分析[J];湖南大学学报(社会科学版);2010年06期

3 杨志群;;多目标决策方法在个人信用评估中的应用[J];长沙民政职业技术学院学报;2009年01期

相关硕士学位论文 前2条

1 张岗岗;稀疏组Lasso方法在个人信贷风险评估中的应用[D];山东大学;2018年

2 董姝娴;商业银行个人信用评价研究[D];华中科技大学;2007年



本文编号:2832994

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/2832994.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0ceeb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com