当前位置:主页 > 经济论文 > 国际贸易论文 >

基于GBDT和LR融合的个人信用评估模型的研究与应用

发布时间:2020-04-16 07:40
【摘要】:随着“互联网+”时代的到来,我国互联网金融行业飞速发展,给人们信用消费带来了快捷与便利。信用消费在促进经济繁荣发展方面充当着一个重要的角色,人们信用消费意愿逐渐加强和消费能力也逐渐提高。国内的大多数互联网金融行业公司也逐渐把个人信用消费业务作为后续研究突破的重要领域之一。然而,个人信用数据规模正在逐渐扩大,社交平台的社交数据和电商平台的电商数据等都可以作为其一部分,互联网金融个人信用原始数据集数据类型复杂而且数据量大。绝大多数的互联网金融行业公司的个人信用评估方法的评估结果不是很理想,这使得个人信用消费业务发展缓慢。本文针对上述问题,通过分析GBDT与LR两种模型的优缺点和互补性,即LR线性模型处理速度快、对全局把握性好但是对特征要求比较高,GBDT适合处理非线性数据,其思想可以用来构造组合特征,充分挖掘数据信息,然而却不能并行进行不适合处理数据量大的数据集,提出了基于GBDT与LR融合的模型。根据UCI德国信用数据集,通过实验单一变量方法利用GBDT模型从原始大量数据中获得组合特征,并将构造的新的特征与原始数据特征一起在利用LR进行训练,通过将得到的结果与其他单一模型进行比较,得到了基于GBDT与LR融合的信用评估模型在预测准确率为87.7%,比单一模型高出很多,方差1.82表明其在稳定性上也具有一定的优势,此融合模型可以进行推广应用。进一步将基于GBDT和LR的融合模型应用到互联网金融数据集上,本次实验采用“Give me some credit”信用数据,首先引入了互联网金融个人信用评估指标体系,在此体系之上对数据集进行了数据预处理,针对处理好的数据集,分别建立了基于GBDT的评估模型、基于LR的评估模型、基于GBDT和LR融合的模型,实验结果显示该融合模型得到的AUC值高达0.85,相较于单一模型有显著提高。本文通过理论和实验进行了论证,基于GBDT与LR的个人信用评估模型在互联网金融个人信用评估领域具有一定的优势,推动我国互联网金融行业的不断发展创新方面具有很大的实践意义,值得研究。
【图文】:

过程图,信用评估,过程


图 2-1 信用评估过程Figure.2-1 The Process of Credit Evaluation在上图 2-1 中,互联网金融模型建立的时候,我们需要考虑消费者历史信用数据特征的选择,选择什么样的分类模型来进行训练,如何评价训练模型的好坏等问题。在这些问题中,,选择适当的分类模型最为关键,本文使用基于 LR 和GBDT 融合的模型,本章接下来的几节将详细介绍该模型建立涉及到的理论基础。2.3 个人信用评估统计方法概论2.3.1 奥卡姆剃刀原理奥卡姆剃刀定律是一个简单并且有效的原理,在机器学习中,我们应当选择的模型是可以充分解读现有数据并且非常简化的模型,即如果有一个简单模型和一个复杂模型在同一个数据集上都有很好地表现效果,那个简单的模型才是应当被使用的,这样不仅可以节约资源、减少浪费,还可以提高效率,是我们所追求[24]

函数图像,函数图像


线性回归的模型函数如下公式(2-6)所示:= LR(逻辑回归)是经常使用的二分类模型[26],需要强调一点即便名字归,逻辑回归模型也并不是回归模型,而是一种经典的分类模型。L线性模型,其思想是基于线性回归的,如下公式(2-7):=tthhh下面公式(2-8)为 Sigmod 函数:y x =tthhht-8)求导有:'=thhthhthtt= t t h Sigmoid 函数的图像分布如图 2-2:
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.09;F724.6;F832.4

【相似文献】

相关期刊论文 前10条

1 李新颖;;个人信用评估研究综述[J];现代商业;2013年21期

2 史宁;;商业银行对个人信用评估的组合预测模型[J];商业研究;2009年11期

3 林镇鸿;陶应根;吴二娇;;个人信用评估模型的选择与修正[J];科技创业月刊;2006年04期

4 李俊丽;王家传;;关于农户个人信用评估的思考[J];南方农村;2006年03期

5 魏志静;刘希玉;魏之旭;;基于支持向量机的个人信用评估方法初探[J];信息技术与信息化;2006年06期

6 宋立峰;魏冬云;;对建立我国个人信用评估体系的设想[J];辽宁经济;2005年12期

7 朱敏,谢荣;构建我国个人信用评估体系两大问题之思考[J];黑河学刊;2005年01期

8 崔金朝;我国个人信用评估体系探析[J];邢台职业技术学院学报;2004年04期

9 何金旗;推进个人信用制度的关键:个人信用评估体系的建立[J];经济师;2004年09期

10 戴志敏,姜宇霏;关于我国银行个人信用评估模型的设计[J];企业经济;2003年04期

相关会议论文 前9条

1 邢立宁;;基于神经网络的个人信用评估模型[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年

2 周晓飞;石勇;;基于数据挖掘的金融信用评估概述[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年

3 王芝s

本文编号:2629551


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2629551.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户98f44***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com