当前位置:主页 > 管理论文 > 统计学论文 >

负债分析中的多重共线性问题研究

发布时间:2020-10-29 13:25
   网络贷款用户的信用评估问题对互联网借贷公司有着非常重要的意义,本文尝试利用用户特征预测用户未来的负债情况,以对现阶段信用评估问题做出新的贡献。线性回归方法是最经典的统计方法之一,直到今天仍有很多新的改进与探讨。本文将利用线性回归模型对用户的未来负债进行预测并探讨几种方法的优劣对比。在进行多元回归时,多重共线性会导致模型出现很多问题,为减小或消除多重共线性带来的影响,本文主要介绍了传统的有偏估计方法与机器学习方法,研究内容可主要分为以下几个部分:首先,简单回顾了最小二乘法与多重共线性对其造成的影响,并介绍了负债分析的含义、作用及可行性。然后,分两部分分别介绍了用于建立线性回归模型的有偏估计方法和机器学习方法:Liu估计,主成分估计和Lasso估计,支持向量回归机和XGBoost模型。分别讨论了这些方法的相关理论、实现过程以及它们改善多重共线性的原理。最后,获取数据进行实证分析,取2018年5月数据预测用户8月的负债借款情况,得到预测结果并对比几种方法在该情况下的适用性与优劣性,最后给出结论。本文针对负债分析问题,对比了几种线性回归算法的预测效果,为今后的应用提供了实例与依据。
【学位单位】:哈尔滨工业大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:C81
【部分图文】:

岭估计


图 3-1 lasso 估计与岭估计的对比 3-1 表示的是当只有两个参数时,lasso 估计(左)与岭估计(右)中误差形状。残差平方和是以最小二乘估计为中心的椭圆轮廓。以原点为域分别是 lasso 与岭估计的约束区域1 2 + t和2 21 2 + t. 系数影所示的约束区域内,那么最先接触到阴影部分的点就是符合最小的点。Lasso 与岭估计的主要区别是 lasso 估计的约束区域是有顶点轮廓与菱形约束的边相切时,其余情况该最小误差平方和的点大多顶点,也就是说这时其中一个自变量系数(即图 3-1 情况中的1 )取值lasso 估计在计算符合条件的最优参数的同时也完成了特征选择的工作(3-28)也可写成惩罚函数表示的形式201 1 11arg min2Np plassoi ij j ji j jy x + 现,lasso 估计的惩罚函数是在最小二乘估计的惩罚函数上增加了一pj .

岭估计


图 3-1 lasso 估计与岭估计的对比 3-1 表示的是当只有两个参数时,lasso 估计(左)与岭估计(右)中误差形状。残差平方和是以最小二乘估计为中心的椭圆轮廓。以原点为域分别是 lasso 与岭估计的约束区域1 2 + t和2 21 2 + t. 系数影所示的约束区域内,那么最先接触到阴影部分的点就是符合最小的点。Lasso 与岭估计的主要区别是 lasso 估计的约束区域是有顶点轮廓与菱形约束的边相切时,其余情况该最小误差平方和的点大多顶点,也就是说这时其中一个自变量系数(即图 3-1 情况中的1 )取值lasso 估计在计算符合条件的最优参数的同时也完成了特征选择的工作(3-28)也可写成惩罚函数表示的形式201 1 11arg min2Np plassoi ij j ji j jy x + 现,lasso 估计的惩罚函数是在最小二乘估计的惩罚函数上增加了一pj .

示意图,角回,法实现,过程


是构建 X 来估计Y .如图 3-2 所示,该算法从0 0开始,这度更小,相似程度更大,也就是( ) ( )1 0 2 0c c , 故沿1x 方向逼1 0 1 1 + x择算法中,会取1 使得1 等于 y 在 方向上的投影;在向前梯度于某个固定的较小的步长 . 而在此算法中,令 ( ) ( 1 1 2 1c c 令2 1 2 2 + u, 其中2u 表示1x 和2x 角平分线方向的单位向量。接受的程度时结束,求得估计参数 .
【相似文献】

相关期刊论文 前10条

1 王义闹;卢庆华;;关于多重共线性的三个知识点的准确表述[J];温州大学学报(自然科学版);2019年03期

2 韩存;毛剑芬;;多重共线性问题及其补救措施[J];内蒙古统计;2009年01期

3 韩存;毛剑芬;;多重共线性问题及其补救措施[J];统计与决策;2008年09期

4 师应来;多重共线性问题探讨[J];统计与决策;1994年05期

5 宋九洲,卢军;动物性状中多重共线性初探[J];黄牛杂志;1995年S1期

6 赵玉新;;多元线性回归中多重共线性的研究[J];产业与科技论坛;2019年03期

7 李从欣;张再生;李国柱;;解决多重共线性的新思路:路径分析[J];统计与决策;2013年01期

8 杨梅;肖静;蔡辉;;多元分析中的多重共线性及其处理方法[J];中国卫生统计;2012年04期

9 陈玲燕;;多重共线性下的线性回归方法综述[J];市场研究;2008年04期

10 刘琼;;多重共线性的程序选优法[J];商场现代化;2008年32期


相关博士学位论文 前2条

1 罗伟林;基于支持向量机方法的船舶操纵运动建模研究[D];上海交通大学;2009年

2 严筱永;无线传感器网络节点定位技术研究[D];南京理工大学;2013年


相关硕士学位论文 前10条

1 徐嘉;负债分析中的多重共线性问题研究[D];哈尔滨工业大学;2019年

2 程书生;关于GM(1,N)模型中多重共线性与自相关性问题的研究[D];武汉理工大学;2018年

3 高阳;对多重共线性检测指标的一些研究[D];兰州大学;2019年

4 于晓牧;logistic回归多重共线性诊断方法的研究[D];大连医科大学;2010年

5 张晓丽;偏最小二乘回归分析若干问题的研究[D];东北师范大学;2010年

6 郭媛媛;基于核主成分回归的多重共线性消除问题研究[D];河北联合大学;2014年

7 张凤莲;多元线性回归中多重共线性问题的解决办法探讨[D];华南理工大学;2010年

8 郭鹏妮;岭回归与分位数回归的研究及结合应用[D];哈尔滨工业大学;2014年

9 李娜娜;多元线性模型与多指标预测[D];武汉科技大学;2006年

10 姚玉臣;影响GDP增长的经济因素分析[D];哈尔滨工业大学;2014年



本文编号:2860961

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2860961.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2b725***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com