面向弱可用数据的小微贷信用挖掘技术研究
发布时间:2022-01-04 23:40
小微企业为了获得发展所需的资金,通常需要向银行贷款。随着计算机技术地进步,传统的线下贷款逐渐被网络贷款所取代。用户信用评级和风险预测一直是网络贷款流程中关键的环节,但同时也存在着一些问题。第一,用户数据的质量不高,弱可用问题普遍存在,无法保证数据的真实性;第二,缺乏面向用户信用等级的科学评判分级体系,无法体现评判结果的客观性;第三,用户贷款风险的预测过程不能有效地利用定性信用指标,无法确保预测结果的可靠性。为了获得更加客观、可靠的用户信用等级评估结果和用户贷款风险预测结果。本文采用“混合插补法”对存在弱可用现象的用户数据进行修复,即针对不同缺失率情况的数据采用不同的处理方法;由于用户数据的信息量较大,如果逐一对用户进行信用等级划分,不仅效率低,而且结果不客观。本文提出利用多任务学习思想对用户基本信用等级进行评估,此方法利用多个信用等级之间的共享结构关系,构造训练网络实现用户的信用评级;同时结合用户的信用初始等级,采用模糊Logistic回归方法预测用户的违约风险。本文的主要贡献是:(1)提出了“混合插补算法”用来补全用户信用缺失的数据。(2)提出利用多任务学习模型评估用户信用等级。(3...
【文章来源】:南京邮电大学江苏省
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
数据预处理和信用评级
南京邮电大学专业学位硕士研究生学位论文第一章绪论9图1.4论文框架图第一章:绪论。首先说明了本文的研究背景以及研究的意义,通过对弱可用数据分析现状和国内外信用评估技术现状的研究,针对信用评级系统在处理用户弱可用数据方面的不足,提出本文研究主题面向弱可用数据的用户信用挖掘技术。第二章:相关背景知识介绍。由于用户信用等级地评估是在完整的数据集上进行的,首先介绍了常用的数据缺失值插补方法,接着介绍了多任务学习的相关知识,包括多任务学习的原理以及界定任务间的相关性,再者介绍了模糊集的相关理念以及模糊数的基本运算,最后分别介绍了李克特量表的使用和Logistic回归模型。第三章:面向弱可用数据的多任务用户基本信用评级。首先介绍了常用的缺失数据处理方法,接着阐述了在面对信用数据的属性缺失问题时,提出了“混合插补”算法填充缺失数据。基于此得到完整的数据集后,再通过信用评级特征矩阵的共性,得出基于共享矩阵的多任务用户信用评估,并进行特征选取,预测用户的基本信用等级。第四章:基于模糊Logistic回归的贷款风险预测。贷款风险预测是判断用户是否会违约的一个重要手段,利用李克特量表将用户定性信用指标量化为具体的分数值,通过三角模糊数对定量数据和定性数据进行模糊化处理,最后基于用户信用实例构建模糊Logistic回归模型预测用户发生违约的可能性。第五章:小微贷原型系统实现和性能分析。首先介绍了本文所使用的实验数据集,接着介绍了系统及实验环境配置、系统框架流程、各个模块的设计以及可视化界面展示,最后将
南京邮电大学专业学位硕士研究生学位论文第二章相关背景知识介绍13目前多任务学习大都通过参数共享来实现,常用的方法分为参数硬共享、参数软共享以及参数分层共享。参数硬共享是当前应用最广泛的共享机制,它将多个任务的属性嵌入到同一个语义空间中,并为每个任务使用特定提取层表示目标任务。硬共享实现非常简单,且能够大大降低过度拟合的风险,适合处理具有较强相关性的任务,但是在处理具有弱相关性的任务时往往表现不佳。参数软共享会为每个目标任务都建立一个模型,并且每个目标任务的模型都可以访问其他目标任务对应模型中的信息。软共享具有很强的灵活性,并且不需要为任务相关性做任何假设,但是每个任务都需要分配一个模型,常常需要增加很多参数。参数分层共享是在模型的低层做较简单的任务,在高层做较困难的任务。分层共享比硬共享要更加灵活,同时又比软共享需要更少的参数。图2.1和2.2展现了多任务学习与传统的单任务学习的不同之处。本文构建了基于共享矩阵的多任务分类预测模型,通过任务之间的信息共享,实现任务分类。图2.1单任务学习图2.2多任务学习
【参考文献】:
期刊论文
[1]不一致弱可用数据近似计算可行性判定问题[J]. 刘雪莉,李建中. 智能计算机与应用. 2018(02)
[2]基于神经网络的企业信用评估模型[J]. 韩冰. 西部皮革. 2018(02)
[3]基于集成学习的中小企业信用评价模型[J]. 王丽梅,王景荣,李向. 当代金融家. 2016(10)
[4]现代信用风险管理模型比较分析[J]. 李文. 金融经济. 2016(04)
[5]信用缺失、融资激励与小微企业发展[J]. 李明贤,罗荷花. 云南财经大学学报. 2013(04)
[6]大数据的一个重要方面:数据可用性[J]. 李建中,刘显敏. 计算机研究与发展. 2013(06)
[7]大数定律与小微企业授信模式研究[J]. 陈勇俊. 上海金融. 2011(12)
[8]基于混合BP神经网络算法的信用卡消费行为风险预测[J]. 刘岚,王霞,林红旭,高建时. 科技管理研究. 2011(17)
[9]基于支持向量机的上市公司信用风险评估研究[J]. 唐建荣,谭春晖. 统计与决策. 2010(10)
[10]客户信用评估方法探析[J]. 邢有洪,程江. 商场现代化. 2008(08)
博士论文
[1]我国小微企业贷款信用风险评估模型研究[D]. 张润驰.南京大学 2018
[2]不一致弱可用数据的近似查询处理研究[D]. 刘雪莉.哈尔滨工业大学 2017
硕士论文
[1]数据挖掘中处理不完全数据的类均值方法及其扩展[D]. 纪燕霞.长安大学 2010
[2]上市公司资产结构与营运能力相关性实证研究[D]. 李春英.广西大学 2007
本文编号:3569283
【文章来源】:南京邮电大学江苏省
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
数据预处理和信用评级
南京邮电大学专业学位硕士研究生学位论文第一章绪论9图1.4论文框架图第一章:绪论。首先说明了本文的研究背景以及研究的意义,通过对弱可用数据分析现状和国内外信用评估技术现状的研究,针对信用评级系统在处理用户弱可用数据方面的不足,提出本文研究主题面向弱可用数据的用户信用挖掘技术。第二章:相关背景知识介绍。由于用户信用等级地评估是在完整的数据集上进行的,首先介绍了常用的数据缺失值插补方法,接着介绍了多任务学习的相关知识,包括多任务学习的原理以及界定任务间的相关性,再者介绍了模糊集的相关理念以及模糊数的基本运算,最后分别介绍了李克特量表的使用和Logistic回归模型。第三章:面向弱可用数据的多任务用户基本信用评级。首先介绍了常用的缺失数据处理方法,接着阐述了在面对信用数据的属性缺失问题时,提出了“混合插补”算法填充缺失数据。基于此得到完整的数据集后,再通过信用评级特征矩阵的共性,得出基于共享矩阵的多任务用户信用评估,并进行特征选取,预测用户的基本信用等级。第四章:基于模糊Logistic回归的贷款风险预测。贷款风险预测是判断用户是否会违约的一个重要手段,利用李克特量表将用户定性信用指标量化为具体的分数值,通过三角模糊数对定量数据和定性数据进行模糊化处理,最后基于用户信用实例构建模糊Logistic回归模型预测用户发生违约的可能性。第五章:小微贷原型系统实现和性能分析。首先介绍了本文所使用的实验数据集,接着介绍了系统及实验环境配置、系统框架流程、各个模块的设计以及可视化界面展示,最后将
南京邮电大学专业学位硕士研究生学位论文第二章相关背景知识介绍13目前多任务学习大都通过参数共享来实现,常用的方法分为参数硬共享、参数软共享以及参数分层共享。参数硬共享是当前应用最广泛的共享机制,它将多个任务的属性嵌入到同一个语义空间中,并为每个任务使用特定提取层表示目标任务。硬共享实现非常简单,且能够大大降低过度拟合的风险,适合处理具有较强相关性的任务,但是在处理具有弱相关性的任务时往往表现不佳。参数软共享会为每个目标任务都建立一个模型,并且每个目标任务的模型都可以访问其他目标任务对应模型中的信息。软共享具有很强的灵活性,并且不需要为任务相关性做任何假设,但是每个任务都需要分配一个模型,常常需要增加很多参数。参数分层共享是在模型的低层做较简单的任务,在高层做较困难的任务。分层共享比硬共享要更加灵活,同时又比软共享需要更少的参数。图2.1和2.2展现了多任务学习与传统的单任务学习的不同之处。本文构建了基于共享矩阵的多任务分类预测模型,通过任务之间的信息共享,实现任务分类。图2.1单任务学习图2.2多任务学习
【参考文献】:
期刊论文
[1]不一致弱可用数据近似计算可行性判定问题[J]. 刘雪莉,李建中. 智能计算机与应用. 2018(02)
[2]基于神经网络的企业信用评估模型[J]. 韩冰. 西部皮革. 2018(02)
[3]基于集成学习的中小企业信用评价模型[J]. 王丽梅,王景荣,李向. 当代金融家. 2016(10)
[4]现代信用风险管理模型比较分析[J]. 李文. 金融经济. 2016(04)
[5]信用缺失、融资激励与小微企业发展[J]. 李明贤,罗荷花. 云南财经大学学报. 2013(04)
[6]大数据的一个重要方面:数据可用性[J]. 李建中,刘显敏. 计算机研究与发展. 2013(06)
[7]大数定律与小微企业授信模式研究[J]. 陈勇俊. 上海金融. 2011(12)
[8]基于混合BP神经网络算法的信用卡消费行为风险预测[J]. 刘岚,王霞,林红旭,高建时. 科技管理研究. 2011(17)
[9]基于支持向量机的上市公司信用风险评估研究[J]. 唐建荣,谭春晖. 统计与决策. 2010(10)
[10]客户信用评估方法探析[J]. 邢有洪,程江. 商场现代化. 2008(08)
博士论文
[1]我国小微企业贷款信用风险评估模型研究[D]. 张润驰.南京大学 2018
[2]不一致弱可用数据的近似查询处理研究[D]. 刘雪莉.哈尔滨工业大学 2017
硕士论文
[1]数据挖掘中处理不完全数据的类均值方法及其扩展[D]. 纪燕霞.长安大学 2010
[2]上市公司资产结构与营运能力相关性实证研究[D]. 李春英.广西大学 2007
本文编号:3569283
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3569283.html
最近更新
教材专著