当前位置:主页 > 经济论文 > 银行论文 >

集成变量选择在个人信用评分中的应用研究

发布时间:2020-10-27 16:48
   信贷决策是消费金融机构里面一项既基础又复杂的任务。信用评分是完成这一任务的重要工具。信用评分通过分析大量的历史数据来帮助信贷专家评价客户的违约风险。信用评分的数据库中通常包含大量的冗余和无关变量,使用所有这些变量来建立信用评分模型不仅耗时而且会引起“维度的诅咒”。这些问题可以通过变量选择来解决。信贷专家主要依靠变量选择方法来提升模型的预测能力,对于变量选择方法的结果的稳定性缺乏足够的重视。变量选择方法的不稳定指的是数据一个小的扰动也会导致大的偏差。变量选择的不稳定会使得筛选出来的风险指标不可靠,从而造成大的经济损失。因此一个稳定的变量选择方法对于正确评估风险具有重要意义。集成学习通过组合多个弱分类器得到一个强分类器解决了模型预测的不稳定性问题,借鉴集成学习的这一思想,通过对多个变量选择方法的结果进行集成,能够有效解决稳定性问题。文章首先对变量选择不稳定的原因进行了解释,然后.对集成变量选择这一方法的理论框架和要素进行了详尽地介绍,但是现有的集成变量选择方法主要是同一类型变量选择方法的集成,而同一类型的变量选择方法有相同的缺点,基于此文章设计了一种新的基于两种类型变量选择方法的集成变量选择方法,其中过滤式方法中选择了皮尔森相关系数,spearman相关系数和中值变量选择;嵌入式方法中选择了逻辑斯蒂回归和基于随机森林的四种变量选择方法,通过把它运用在一个互联网金融公司的信用数据集上,在稳定性上方差接近于0且相似性值接近于1,这说明集成变量选择能够显著提高稳定性;在预测结果上,通过把集成变量选择的结果带入逻辑斯蒂回归中,发现它优于基于全变量逻辑斯蒂回归和弹性网惩罚的逻辑斯蒂回归,证明了提高变量选择的稳定性并没有牺牲模型的预测能力,同时基于预测结果的置换检验是显著的,证明基于集成变量选择的预测具有鲁棒性。
【学位单位】:天津财经大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:F832.4
【文章目录】:
内容摘要
Abstract
第1章 导论
    1.1 研究背景和研究意义
    1.2 国内外现状
        1.2.1 信用评分现状
        1.2.2 变量选择在信用评分中的应用
    1.3 论文结构和创新
        1.3.1 论文结构
        1.3.2 创新和不足之处
第2章 个人信用评分
    2.1 个人信用评分的商业背景
    2.2 个人信用评分的类型
    2.3 个人信用评分的原理
    2.4 信贷数据的特点
第3章 变量选择方法及其稳定性
    3.1 变量选择的目的
    3.2 变量选择的基本分类
        3.2.1 过滤式类型
        3.2.2 包裹式类型
        3.2.3 嵌入式类型
    3.3 变量选择不稳定的来源及其度量
        3.3.1 变量选择不稳定的来源
        3.3.2 变量选择稳定性的度量
第4章 集成变量选择
    4.1 集成变量选择的基本模式
        4.1.1 同质并行集成变量选择
        4.1.2 异质并行集成变量选择
        4.1.3 混合的集成变量选择
    4.2 集成变量选择的基本要素
        4.2.1 变量集的集成
        4.2.2 稳定性评价
        4.2.3 稳定性和预测性的权衡
    4.3 新的模式—基于两种类型变量选择方法的集成
        4.3.1 选择的过滤式和嵌入式变量选择方法
        4.3.2 变量选择结果的集成
        4.3.3 稳定性评价
        4.3.4 预测能力评价
第5章 集成变量选择在个人信用评分中的应用
    5.1 数据介绍和预处理
    5.2 集成变量选择
    5.3 稳定性评价
    5.4 预测能力评价
    5.5 小结
第6章 结论和展望
    6.1 结论
    6.2 展望
附录
参考文献
后记

【相似文献】

相关期刊论文 前10条

1 牟建波;刘赪;;基于惩罚方法的贝叶斯群组变量选择[J];绵阳师范学院学报;2017年02期

2 戴伯新;;回归变量选择中的数据诊断[J];应用概率统计;1992年04期

3 王银辉;徐文科;;基于风险函数评价自变量选择对预测的影响[J];哈尔滨师范大学自然科学学报;2012年01期

4 张春霞;李俊丽;;变量选择集成方法[J];工程数学学报;2019年01期

5 李太福;易军;苏盈盈;胡文金;余春娇;;基于特征子空间虚假邻点判别的软传感器模型变量选择[J];机械工程学报;2011年12期

6 张庆;李云霞;;函数型变量选择法用于空气质量影响因素实证分析[J];安庆师范大学学报(自然科学版);2017年04期

7 李扬;许文甫;马双鸽;;污染数据的稳健稀疏成组变量选择方法研究[J];统计与信息论坛;2018年06期

8 徐安察;王玮明;;应用统计类专业探究性教学模式探索与实践——以变量选择准则为例[J];赤峰学院学报(自然科学版);2014年19期

9 杨红;陈德棉;;个人住房抵押贷款违约相关变量选择[J];现代管理科学;2009年04期

10 钟先乐;樊亚莉;张探探;;基于t函数的稳健变量选择方法[J];上海理工大学学报;2017年06期


相关博士学位论文 前10条

1 初一;若干模型下的变量选择和特征筛选[D];山东大学;2018年

2 王延新;高维模型的变量选择与稀疏正则化[D];武汉大学;2013年

3 李子林;高维基因数据中的统计方法[D];清华大学;2016年

4 唐凯临;变量选择和变换的新方法研究[D];同济大学;2008年

5 秦志敏;我国上市公司财务预警变量选择研究[D];东北财经大学;2012年

6 袁晶;贝叶斯方法在变量选择问题中的应用[D];山东大学;2013年

7 姬永刚;分位数回归中的贝叶斯变量选择[D];东北师范大学;2012年

8 赵军;Expectile回归和最优资产组合中的变量选择问题[D];浙江大学;2017年

9 苏盈盈;基于核方法的非线性系统变量选择及其应用[D];重庆大学;2014年

10 王歆旸;几类整值时间序列模型的拟似然推断和变量选择问题[D];吉林大学;2017年


相关硕士学位论文 前10条

1 杨小辉;集成变量选择在个人信用评分中的应用研究[D];天津财经大学;2018年

2 何琪琪;带测量误差的可加模型的变量选择[D];厦门大学;2018年

3 胡蓉;基于随机Lasso的Meta分析[D];北京建筑大学;2019年

4 杨阳;SGL-SVM方法及其应用研究[D];厦门大学;2017年

5 武杰;Logistic回归中的随机Lasso方法[D];北京建筑大学;2018年

6 耿莹;Random Lasso在Logistic模型中的应用研究[D];暨南大学;2018年

7 郝宽;Lasso及其改进方法在变量选择中的优劣性研究[D];哈尔滨工业大学;2018年

8 褚福常;基于互信息变量选择的热工过程数据建模[D];华北电力大学;2018年

9 曾翠英;高维数据下变量选择问题的研究[D];长沙理工大学;2017年

10 宋雨宸;基于模型集群分析的近红外光谱变量选择方法研究[D];长春理工大学;2018年



本文编号:2858784

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/2858784.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8484a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com