当前位置:主页 > 经济论文 > 银行论文 >

基于自适应LASSO变量选择的Logistic信用评分模型研究

发布时间:2018-09-09 10:28
【摘要】:本文主要研究的是信用评分模型中的变量选择问题,变量选择不仅是建模过程中需要考虑的问题,也是统计学研究中很重要的问题之一。在建模中不仅要确保选择的变量集合能反映所要研究的对象特性,还要保证得到的结果具有较好的拟合性和预测性。本文主要工作如下:一系统介绍了变量选择的方法:子集选择法和系数压缩法。子集选择法包括AIC值、BIC值和逐步回归法,系数压缩法包括岭回归、LASSO以及自适应LASSO.分析了信用评分模型的发展,变量选择在信用评分模型建立中的关键作用,以及国内外研究现状。二研究了Logistic模型的自适应LASSO变量选择和参数估计,核心是讨论将变量的信息价值作为自适应LASSO的惩罚项权重,以及证明其得到的参数估计量具有Oracle性质。由此构建了基于信息权重的Logistic信用评分模型。三进行了实证分析,主要通过对深交所148家中小企业以及30个信用指标体系变量进行以信息价值为惩罚项权重的自适应LASSO变量选择,建立Logistic信用评分模型,并利用发生比率来解释估计量的含义,并对选择的变量进行经济意义检验,可知模型包含的变量基本涵盖了企业的各项能力指标。最后并通过对比逐步回归法和LASSO两种变量选择法建立的logistic信用评分模型,利用ROC曲线、KS值、WGRP和CIER指标来比较验证三种模型的风险区分能力和估计准确性,得到自适应LASSO建立的Logistic模型要好于其他两种方法得到的模型,也表明了包含信息价值的自适应LASSO变量选择方法在实证检验中具有很好的表现。
[Abstract]:In this paper, the problem of variable selection in credit scoring model is mainly studied. Variable selection is not only a problem to be considered in the modeling process, but also one of the most important problems in statistical research. In modeling, it is necessary not only to ensure that the selected set of variables can reflect the characteristics of the object to be studied, but also to ensure that the obtained results have good fitting and predictability. The main work of this paper is as follows: firstly, the methods of variable selection, subset selection and coefficient compression are introduced systematically. Subset selection includes AIC and stepwise regression, coefficient compression includes ridge regression and adaptive LASSO.. This paper analyzes the development of credit scoring model, the key role of variable selection in the establishment of credit scoring model, and the current research situation at home and abroad. Secondly, the adaptive LASSO variable selection and parameter estimation of Logistic model are studied. The key is to consider the information value of the variable as the weight of the penalty term of adaptive LASSO, and to prove that the parameter estimator has Oracle property. Based on this, the Logistic credit scoring model based on information weight is constructed. Thirdly, through the empirical analysis, this paper establishes the Logistic credit scoring model by selecting the adaptive LASSO variables with the weight of information value as punishment item, mainly through 148 SMEs and 30 credit index system variables of Shenzhen Stock Exchange. Using the ratio of occurrence to explain the meaning of the estimator and to test the economic significance of the selected variables, it can be seen that the variables contained in the model basically cover the various capability indicators of the enterprise. Finally, by comparing the logistic credit rating model established by stepwise regression method and LASSO variable selection method, using ROC curve KS value and CIER index to compare and verify the risk differentiation ability and estimation accuracy of the three models. The Logistic model established by adaptive LASSO is better than that obtained by the other two methods. It also shows that the adaptive LASSO variable selection method with information value has a good performance in the empirical test.
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F832.4

【相似文献】

相关期刊论文 前10条

1 高仁祥,张世英,刘豹;基于神经网络的变量选择方法[J];系统工程学报;1998年02期

2 杨璐,高自友;用神经网络进行变量选择[J];北方交通大学学报;1999年03期

3 赵进文;模型构建中变量选择的影响分析[J];东北财经大学学报;2002年06期

4 李扬;朱建锋;谢邦昌;;变量选择方法及其在健康食品市场研究中的应用探究[J];统计与信息论坛;2013年10期

5 周伟,王建军,李继锐;基于人工神经网络的影响高速公路社会效益量化的变量选择方法[J];西安公路交通大学学报;2000年03期

6 齐晓丽;梁慧超;冯彦妍;;回归模型构建中变量选择的研究[J];河北工业大学学报;2009年06期

7 邓金兰;王彬寰;樊仕利;;变系数模型的变量选择及在股票数据中的应用[J];四川大学学报(自然科学版);2009年06期

8 胡心瀚;叶五一;缪柏其;;上市公司信用风险分析模型中的变量选择[J];数理统计与管理;2012年06期

9 杨金英;;变系数模型的快速变量选择方法[J];统计与决策;2012年05期

10 汪建均;马义中;;结合GLM与因子效应原则的贝叶斯变量选择方法[J];系统工程理论与实践;2013年08期

相关会议论文 前6条

1 张俊华;方伟武;;调查表分析中变量选择的一些方法(英文)[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年

2 李洪东;梁逸曾;;高维数据变量选择新方法研究[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年

3 李慷;席裕庚;;复杂过程系统中操作变量选择与定位的方法研究[A];1993年控制理论及其应用年会论文集[C];1993年

4 云永欢;王为婷;梁逸曾;;迭代的保留有信息变量来筛选最佳变量子集的一种多元校正变量选择方法[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年

5 徐登;范伟;梁逸曾;;紫外光谱结合变量选择和偏最小二乘回归同时测定水中重金属镉、锌、钴[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年

6 梁逸曾;李洪东;许青松;曹东升;张志敏;;灰色化学建模与模型集群分析——兼论过拟合、稳健估计、变量选择与模型评价[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年

相关博士学位论文 前10条

1 吕晶;几类半参数回归模型的稳健估计与变量选择[D];重庆大学;2015年

2 王康宁;几类高维复杂数据半参数模型的结构识别、变量选择及稳健估计[D];山东大学;2016年

3 王大荣;分散度量模型中的变量选择[D];北京工业大学;2009年

4 王明秋;高维数据下若干回归模型的变量选择问题研究[D];大连理工大学;2012年

5 刘吉彩;生存数据统计模型的变量选择方法[D];华东师范大学;2014年

6 樊亚莉;稳健变量选择方法的若干问题研究[D];复旦大学;2013年

7 唐凯临;变量选择和变换的新方法研究[D];同济大学;2008年

8 董莹;高维共线性统计模型的参数估计与变量选择[D];大连理工大学;2014年

9 叶飞;相对误差准则下的估计理论和变量选择方法的研究[D];清华大学;2013年

10 袁晶;贝叶斯方法在变量选择问题中的应用[D];山东大学;2013年

相关硕士学位论文 前10条

1 潘玉婷;含多元非线性结构的高维Logistic模型的同时变量选择及半参数估计[D];中国科学技术大学;2016年

2 刘丹;Cox模型及变系数Cox模型中的变量选择问题研究[D];暨南大学;2016年

3 罗昊;基于自适应LASSO变量选择的Logistic信用评分模型研究[D];东南大学;2016年

4 王双宝;基于变量选择偏差的变量选择过程[D];电子科技大学;2016年

5 温征;纵向和生存数据联合模型的一个变量选择问题[D];云南师范大学;2016年

6 闫闯;多元回归模型中变量选择问题研究[D];黑龙江大学;2011年

7 康赞亮;计量经济学模型变量选择与设定的理论方法研究[D];清华大学;2009年

8 张丹;乘积模型的变量选择[D];河南大学;2014年

9 郝亚楠;基于L_2-Fused Lasso变量选择方法的性质及应用研究[D];北京交通大学;2014年

10 满敬銮;生存数据模型的变量选择[D];中南大学;2009年



本文编号:2232123

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/2232123.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户344f6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com