当前位置:主页 > 经济论文 > 国际贸易论文 >

基于决策树C5.0算法的P2P平台个人信用评分研究

发布时间:2020-07-13 22:59
【摘要】:作为普惠金融的重要组成,P2P网贷依靠其便捷、高效、投资门槛低等特点在个人贷款和小微企业融资方面发挥了重要作用。但事物皆有两面性,P2P网贷在迅猛发展的同时,也面临了重大的信用风险,尤其在当下监管趋紧、打破刚性兑付成趋势的现实情况下,如何从根源把控借款人信用风险对P2P平台方来说显得愈加重要。个人信用风险评分是有效识别并降低信用风险的决定性因素,而决策树分类模型依靠其分类精度高、易于实现的优点被广发应用于个人信用评分领域。文章选取国内网贷平台纯信用标的借款数据作为研究对象,运用最新的决策树分类模型C5.0算法对借款人信用风险进行预测评估。在实际评分工作中,有所谓“垃圾进去,垃圾出来”,即评分数据对评分预测结果影响重大,文章依据5C+1S方法对网贷平台借款人数据进行分类、构建信用评分指标体系,同时对类别字段进行了属性合并,并对类别字段取值进行了合理降维处理,以达到精简模型和防止过度拟合的效果。实证研究结果表明,进行数据处理后的训练样本分类预测精度下降控制在了 1%以内,而测试样本的分类预测精度提高了 3.16%。在模型优化改进方面,文章引入误判成本及误判矩阵,通过提高第二类错误的误判成本,达到降低第二类错误率的目的,这也符合实际评分工作中的具体情况。实证研究表明,在确定合理的误判成本矩阵之后,虽然测试样本集第一类错误率增加了 2.93%,但对实际评分中损失影响更大的第二类错误率下降了 7.35%。根据最终的决策树C5.0模型所输出了各变量重要性结论,文章有针对性地提出了相关建议。即P2P平台方应在加强自身信用风险控制能力的同时,将对接央行征信与第三方征信合理结合,并采用大数据征信扩大对借款人信用审核的维度以及深度。
【学位授予单位】:天津财经大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F832.4;F724.6
【图文】:

信息熵,资料来源,作者,授信


(不授信邋j逦(mmj逡逑图2.邋3决策树分类学习方法举例逡逑资料来源:作者整理逡逑图2.邋3是一颗典型的决策树,用于根据贷款申请人的各项信息来决定是否对改贷款人逡逑进行放贷,其中表示类别属性的内部节点用矩形表示,用以分类的叶节用楠圆来表示。若逡逑贷款人拥有担保或抵押,则对其进行授信放贷,如果该借款人没有抵押或担保,且月收入逡逑16逡逑

借款利率,属性变量,重要性,字段


重要性指标越大,该类别属性便越重要,分析变量重要性,可以为P2P网贷平台控制信用逡逑风险提供合理建议。逡逑由最终决策树模型输出的变量重要性如图4.邋2所示,排名依次为:借款利率(0.邋1923)、逡逑借款期限(0.1522)、历史违约记录(0.1296)、工作时间(0.0934)、信用认证(0.0689)、公逡逑司所处产业类型(0.0681)、收入水平(0.0611)、房产(0.0543)、性别(0.0532)、工作类别逡逑(0.0522)、婚姻状况(0.0221)、借款金额(0.0211)、车产(0.0111)、借款目的(0.0102)、逡逑工作地点(0.0102)。逡逑变Mifi要性逡逑0.2500逡逑0.2000逡逑0.1500逦|逦^逡逑::1邋I邋I邋I邋I邋I邋I邋I邋I邋I逦逡逑^逦v邋x逦v:逦*\^v逡逑'、V'邋念?、含\逦、r邋c逦'、.《、令.、逦、t、.邋\逡逑,、'二逡逑As逡逑图4.2各属性变量重要性逡逑从图中可以看出对模型影响最大的是借款利率指标,同时在借款利率也是所有字段中逡逑信息增益率最大的属性,这也充分说明了借款利率指标与违约情况关联十分高,由于文章逡逑所选取的实证数据均为信用标的借款,借款人在发布了借款标的之后,由投资人依据其在逡逑平台留下的各个维度的基本信息来判断是否对其进行投资,如果投资人认为某个借款人未逡逑来违约风险较大,则该笔借款标的便为成为流标,如果借款人还想获得借款便需要继续重逡逑新发布借款信息,在此过程中借款人也在不断调整借款利率,所以最终的借款利率数据也逡逑是借款人和资金端投资人相互博弈的结果

【相似文献】

相关期刊论文 前10条

1 田婕;;打开信用评分市场大门[J];金融电子化;2006年05期

2 吴洁;信用评分技术在中小企业贷款中的应用[J];现代金融;2005年08期

3 韩茜;任丽蓉;刘道瞳;千梦强;杨天尊;郭凯;;基于大数据的个人信用评分发展新趋势[J];创新科技;2018年02期

4 李延东;郑小娟;;信用评分卡体系的发展及应用[J];青海金融;2016年06期

5 潘勇;;逆向选择视角下信用评分机制与担保机制的效用研究——基于淘宝网的案例分析[J];商业经济与管理;2013年06期

6 李延东;郑小娟;;信用评分卡体系的发展及应用[J];甘肃金融;2016年03期

7 宋哲;宋文祥;;个人信用评分:不可忽视的“信誉财富”[J];当代金融家;2016年08期

8 林治乾;严志辉;;信用评分卡在中小企业贷款业务中的应用[J];银行家;2013年02期

9 黎玉华;;信用评分卡模型的建立[J];科技信息;2010年13期

10 林治乾;张鹏逸;崔紫莹;;中小企业信用评分卡系统的构建与实施[J];银行家;2013年07期

相关会议论文 前1条

1 李建平;潘若愚;李轶琳;;一种简单而有效的信用评分方法[A];2004年中国管理科学学术会议论文集[C];2004年

相关重要报纸文章 前10条

1 叶大清 李英浩;信用评分:数据、技术和应用[N];金融时报;2014年

2 赵宁;“个人信用评分”是怎么回事[N];检察日报;2000年

3 中国金融电子化公司信用评分工作小组;信用评分如何实现本土化[N];金融时报;2006年

4 田婕;美国信用评分应用的做法与经验[N];金融时报;2006年

5 于津生;信用评分方法的技术基础[N];金融时报;2006年

6 经济法学者 王立;市场化个人信用评分工具的“软约束”[N];上海证券报;2018年

7 李铭;通用信用评分在美国市场的应用[N];金融时报;2014年

8 深圳商报记者 吴玉函;信用评分或影响婚恋交友[N];深圳商报;2015年

9 记者 童芬芬;民营征信开推个人信用评分[N];中华工商时报;2015年

10 深圳商报记者 李钦;深圳给600万市民评信用等级[N];深圳商报;2005年

相关博士学位论文 前4条

1 陈昊洁;基于选择性集成算法的个人信用评分方法研究[D];哈尔滨工业大学;2016年

2 刘_";信用评分理论与应用研究[D];湖南大学;2010年

3 向晖;个人信用评分组合模型研究与应用[D];湖南大学;2011年

4 陈为民;基于支持向量机的信用卡信用风险管理模型与技术研究[D];湖南大学;2009年

相关硕士学位论文 前10条

1 张泽伟;基于决策树C5.0算法的P2P平台个人信用评分研究[D];天津财经大学;2018年

2 黄日康;基于XGBoost算法的个人信用评分方案策划[D];上海师范大学;2019年

3 卢婵;宁夏小微企业信用评分问题研究[D];东北大学;2015年

4 李昕;拒绝推断在信用评分卡模型中的应用[D];重庆大学;2018年

5 沈一;基于小额贷款的信用评分堆叠模型研究与应用[D];天津商业大学;2018年

6 杨静;信用评分卡的建立与应用[D];天津商业大学;2018年

7 雒航通;基于DBN的改进深度学习模型及应用研究[D];西安理工大学;2018年

8 张婷婷;Logistic回归及其相关方法在个人信用评分中的应用[D];太原理工大学;2017年

9 杨志群;消费信贷中的个人信用评分研究[D];湖南大学;2011年

10 张飞;个人信用评分组合模型研究[D];电子科技大学;2015年



本文编号:2754101

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2754101.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户386ad***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com