基于大数据的个人信用评估及预警模型研究
发布时间:2021-11-06 23:35
随着金融行业和互联网行业的紧密结合,国内各金融机构纷纷把个人消费贷款业务作为未来的发展战略之一,而其中个人信用风险控制作用至关重要。通过将用户在各个层面上的行为进行数据化和整合化,运用并行化和深度挖掘的方式,将用户消费和行为信息转化为个人信用的评估依据,以此来为各金融机构提供个人信用风险控制。在大数据领域,传统的风险模型存在处理效率及精确度难以适应的问题。因此,如何结合传统风险评估模型和机器学习技术,针对大数据特性,获得一个更加精准的评估模型,是一个值得研究的课题。本文的研究内容就围绕这个问题展开。主要的工作包括:(1)就模型的数据基础、表现定义及逻辑、样本分类和抽样方案等建模基础信息进行详细介绍及分析,并提出大数据环境下的个人信用风险评估模型——CEvaluation+。(2)从不同维度来构建用户信用画像,进行数据收集、数据核对、数据清洗、因子分析法等预处理方法。(3)结合高效、可解释性的Logistic算法以及高精确度和低数据分布要求的深度学习模型,构建评估预警模型。具体过程是:先对待处理的数据使用Logistic算法进行预判,对预判结果为―坏用户‖以及―中间用户‖的案例,将决策树...
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
逐回归基本骤Fig.2-1Basicprocessofstepwiseregression主成分分析法是解决重叠变量的有效分析方法,通过识别变量之间的相关关
图 2-2 单 神经元结构模Fig.2-2 A single neuron structure model的结构模型,我们可以按照其上的符号标注,描绘其工作是输入端,接收来自用户输入的数值。每一个输入都对应一个权值i ,求出所有输入的加权和应关系如下:为激活函数进行转换,通常其为非线性特征函数,如此便线性的变换,最终输出结果 y。经元模型主要为阈值型、分段线性型、Sigmoid 函数型和 T Sigmoid 函数型的神经元。图 2-3 为对应的模型图。它通接节点之间的权值实现信息处理,也正是通过调节权值,应的能力。神经网络模型主要分为前向网络和反馈网络,
14图 2-3 常用神经元模[29]Fig.2-3 Commonly used neuron model2.2.4 SVM 模型SVM(Support Vector Machine)指的是支持向量机,它的提出来源于统计学理论。通过对线性可分的改进,使该学习模型具备监督性。所以在回归分析和分类等领域有着广泛的使用。SVM 之所以称为线性可分问题的进阶解决方案,主要对于非线性可分问题也可以进行很好的解决。它通过一个非线性映射,将其转换为高维特征空间中,从而转换为线性可分的问题,使得复杂的问题也能得以解决[17]。虽然提升维度会带来众多问题,特别是计算时间的大幅度提高,但是针对无法线性处理的样本集,这无疑是极具突破性的。通过样本空间的巧妙转换也可以解决分类、聚类等问题,对于复杂的划分也可以做到迎刃而解。划分方法类似于在特征空间中构建最优超
【参考文献】:
期刊论文
[1]互联网金融时代商业银行发展个人信贷业务探究[J]. 崔勇,穆乐华,景士晶,佟翠英,郝静,徐琳,林更. 北京金融评论. 2017(02)
[2]我国互联网金融的风险与防范研究[J]. 吴抒曼. 现代金融. 2017(02)
[3]运用ANNs算法和BP算法对产业优化转型升级研究[J]. 林锋,黄丽华. 贵阳学院学报(自然科学版). 2016(04)
[4]基于随机森林算法的绿色信贷信用风险评估研究[J]. 李进. 金融理论与实践. 2015(11)
[5]基于决策树的P2P网贷信用风险评价[J]. 孙同阳,谢朝阳. 商业经济研究. 2015(02)
[6]互联网金融风险控制[J]. 孙淑萍. 金融理论与实践. 2014(11)
[7]商业银行的个人信用评估研究:基于PCA-GA-BP算法[J]. 王天擎,刘小清. 价值工程. 2014(31)
[8]关于当前互联网金融征信发展的思考[J]. 袁新峰. 征信. 2014(01)
[9]基于Logistics回归算法的证券客户流失预测模型及应用[J]. 吴斌,应力. 金融电子化. 2013(07)
博士论文
[1]基于大数据的个人信用风险评估模型研究[D]. 张万军.对外经济贸易大学 2016
硕士论文
[1]基于BP神经网络模型的中国P2P借款人信用风险评估研究[D]. 黄震.北京交通大学 2015
[2]商业银行个人信用评估模型研究[D]. 张健.广西大学 2012
本文编号:3480735
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
逐回归基本骤Fig.2-1Basicprocessofstepwiseregression主成分分析法是解决重叠变量的有效分析方法,通过识别变量之间的相关关
图 2-2 单 神经元结构模Fig.2-2 A single neuron structure model的结构模型,我们可以按照其上的符号标注,描绘其工作是输入端,接收来自用户输入的数值。每一个输入都对应一个权值i ,求出所有输入的加权和应关系如下:为激活函数进行转换,通常其为非线性特征函数,如此便线性的变换,最终输出结果 y。经元模型主要为阈值型、分段线性型、Sigmoid 函数型和 T Sigmoid 函数型的神经元。图 2-3 为对应的模型图。它通接节点之间的权值实现信息处理,也正是通过调节权值,应的能力。神经网络模型主要分为前向网络和反馈网络,
14图 2-3 常用神经元模[29]Fig.2-3 Commonly used neuron model2.2.4 SVM 模型SVM(Support Vector Machine)指的是支持向量机,它的提出来源于统计学理论。通过对线性可分的改进,使该学习模型具备监督性。所以在回归分析和分类等领域有着广泛的使用。SVM 之所以称为线性可分问题的进阶解决方案,主要对于非线性可分问题也可以进行很好的解决。它通过一个非线性映射,将其转换为高维特征空间中,从而转换为线性可分的问题,使得复杂的问题也能得以解决[17]。虽然提升维度会带来众多问题,特别是计算时间的大幅度提高,但是针对无法线性处理的样本集,这无疑是极具突破性的。通过样本空间的巧妙转换也可以解决分类、聚类等问题,对于复杂的划分也可以做到迎刃而解。划分方法类似于在特征空间中构建最优超
【参考文献】:
期刊论文
[1]互联网金融时代商业银行发展个人信贷业务探究[J]. 崔勇,穆乐华,景士晶,佟翠英,郝静,徐琳,林更. 北京金融评论. 2017(02)
[2]我国互联网金融的风险与防范研究[J]. 吴抒曼. 现代金融. 2017(02)
[3]运用ANNs算法和BP算法对产业优化转型升级研究[J]. 林锋,黄丽华. 贵阳学院学报(自然科学版). 2016(04)
[4]基于随机森林算法的绿色信贷信用风险评估研究[J]. 李进. 金融理论与实践. 2015(11)
[5]基于决策树的P2P网贷信用风险评价[J]. 孙同阳,谢朝阳. 商业经济研究. 2015(02)
[6]互联网金融风险控制[J]. 孙淑萍. 金融理论与实践. 2014(11)
[7]商业银行的个人信用评估研究:基于PCA-GA-BP算法[J]. 王天擎,刘小清. 价值工程. 2014(31)
[8]关于当前互联网金融征信发展的思考[J]. 袁新峰. 征信. 2014(01)
[9]基于Logistics回归算法的证券客户流失预测模型及应用[J]. 吴斌,应力. 金融电子化. 2013(07)
博士论文
[1]基于大数据的个人信用风险评估模型研究[D]. 张万军.对外经济贸易大学 2016
硕士论文
[1]基于BP神经网络模型的中国P2P借款人信用风险评估研究[D]. 黄震.北京交通大学 2015
[2]商业银行个人信用评估模型研究[D]. 张健.广西大学 2012
本文编号:3480735
本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/3480735.html