高维多重共线性数据特征筛选
发布时间:2021-04-16 23:58
随着信息技术的不断发展,在金融、气象预测、基因研究等一些领域中,统计学家常能够收集到高维数据。但由于维数过高,传统的统计分析方法和变量选择方法变得不再稳健和难以适用。并且还有其他的难题需要去克服,例如当误差分布为厚尾分布时,它们的效率都普遍较低甚至它们会变得无法适用;还有当自变量间存在严重的多重共线性时,这也会严重干扰到变量选择方法的筛选效果。为了克服多重共线性,本文突破性地提出能够应对存在多重共线性高维线性数据的稳健的高维特征筛选法。本文的主要工作如下:第一章阐述了在面临高维数据时变量筛选的研究现状与历史,并且对一些常用特征筛选方法进行了回顾和学习,最后对本文的内容安排和创新点进行了说明。第二章中提出一种针对多重共线性的高维特征筛选法,可处理存在多重共线性这类型的高维数据。当下很多针对高维线性模型的研究都是基于单一的边际效应下进行的,变量的筛选依赖于变量之间相互独立,这使得当存在变量间存在多重共线性时可能导致变量筛选的不稳定性,本文通过引入净效应的这一概念,让自变量的净效应替代其边际效应,提出一种基于全局影响的特征筛选方法,这使得其筛选方法的适用范围更广,并进一步通过证明得到了确定筛...
【文章来源】:江西师范大学江西省
【文章页数】:33 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及现状
1.1.1 超高维特征筛选
1.1.2 多重共线性
1.2 常用特征筛选方法概述
1.2.1 SIS方法
1.2.2 DC-SIS方法
1.3 本文主要内容及创新点
2 高维多重共线性型数据的变量筛选研究
2.1 引言
2.2 筛选方法与理论研究
2.2.1 筛选方法
2.2.2 理论性质
2.3 定理证明
3 数值模拟与实例分析
3.1 数值模拟
3.2 实例分析
4 总结与展望
4.1 研究总结
4.2 研究展望
参考文献
致谢
本文编号:3142411
【文章来源】:江西师范大学江西省
【文章页数】:33 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及现状
1.1.1 超高维特征筛选
1.1.2 多重共线性
1.2 常用特征筛选方法概述
1.2.1 SIS方法
1.2.2 DC-SIS方法
1.3 本文主要内容及创新点
2 高维多重共线性型数据的变量筛选研究
2.1 引言
2.2 筛选方法与理论研究
2.2.1 筛选方法
2.2.2 理论性质
2.3 定理证明
3 数值模拟与实例分析
3.1 数值模拟
3.2 实例分析
4 总结与展望
4.1 研究总结
4.2 研究展望
参考文献
致谢
本文编号:3142411
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3142411.html