变量选择方法在复杂群组数据中的研究及应用
发布时间:2021-08-03 12:20
随着互联网技术的快速发展,人们获取得数据维数越来越高,数据结构越来越复杂,变量多以群组形式出现.如何对超高维复杂群组数据进行有效降维需要进一步去研究.ADS(Adaptive Dantzig Selector)方法是处理超高维数据的重要方法,本文主要研究了该方法在部分线性模型下的渐近正态性以及GADS(Group Adaptive Dantzig Selector)方法在复杂群组变量数据中的理论性质与实际应用.具体的研究内容与结果如下:(1)将ADS方法应用于部分线性模型,通过理论证明了部分线性模型下的ADS方法具有渐近正态性,数据模拟结果显示ADS方法得到的估计值更加精准,数据实例验证了 ADS方法相比于Lasso方法在处理超高维稀疏性数据上的优良性.(2)将ADS方法结合复杂群组变量的数据结构特点提出用于处理群组变量的GADS方法,该方法的主要原理是在GDS惩罚的基础上,对不同的组系数施加不同的惩罚力度,从而更精确的选择组变量.通过理论证明了GADS方法的渐近正态性,并通过实例验证了 GADS方法在处理复杂群组数据时得到的估计值明显优于Group Lasso方法.(3)针对超高维群...
【文章来源】:广西大学广西壮族自治区 211工程院校
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 选题背景
1.2 国内外相关研究动态
1.2.1 变量选择方法的研究动态
1.2.2 群组变量的研究动态
1.3 文章的内容及结构安排
第2章 相关理论基础
2.1 部分线性模型
2.2 线性模型下变量选择方法
2.3 群组变量选择方法
2.4 SIS筛选方法
2.5 本章小结
第3章 部分线性模型下ADS方法的渐近正态性
3.1 引言
3.2 部分线性模型下ADS估计的定义
3.3 ADS估计的渐近正态性
3.4 数值模拟
3.5 外卖数据分析
3.6 本章小结
第4章 群组变量GADS方法的渐近正态性
4.1 引言
4.2 GADS方法的定义
4.3 GADS估计的渐近正态性
4.4 店铺数据分析
4.5 本章小结
第5章 基于复杂群组下的S-GADS方法
5.1 引言
5.2 复杂群组下新的GADS方法
5.3 降维筛选S-GADS方法
5.4 数值模拟
5.5 本章小结
结论与展望
参考文献
致谢
攻读学位期间论文发表情况
【参考文献】:
期刊论文
[1]纵向数据下部分线性模型基于经验似然的变量选择[J]. 于卓熙,李梦丽. 吉林大学学报(理学版). 2018(04)
[2]改进的强相关数据的变量选择方法[J]. 徐若南,唐烁,王旭辉. 大学数学. 2017(01)
[3]基于惩罚方法的贝叶斯群组变量选择[J]. 牟建波,刘赪. 绵阳师范学院学报. 2017(02)
[4]高维数据下群组变量选择的惩罚方法综述[J]. 王小燕,谢邦昌,马双鸽,方匡南. 数理统计与管理. 2015(06)
[5]大数据时代的高维统计:稀疏建模的发展及其应用[J]. 李仲达,林建浩,王美今. 统计研究. 2015(10)
[6]Logistic回归的双层变量选择研究[J]. 王小燕,方匡南,谢邦昌. 统计研究. 2014(09)
[7]线性回归模型中变量选择方法综述[J]. 王大荣,张忠占. 数理统计与管理. 2010(04)
博士论文
[1]若干高维模型变量选择和模型重建问题的研究[D]. 盖玉洁.山东大学 2011
[2]经验似然纵向数据和似然Dantzig Selector方法[D]. 胡爽.山东大学 2011
[3]非参和半参回归模型的稳健和截面推断[D]. 李锋.山东大学 2010
硕士论文
[1]超高维数据部分线性模型的变量选择[D]. 李冰月.北京工业大学 2017
[2]基于Group SCAD的组变量选择[D]. 郭骁.西北大学 2016
[3]几类回归模型中的变量选择方法[D]. 刘琳.广西大学 2013
本文编号:3319611
【文章来源】:广西大学广西壮族自治区 211工程院校
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 选题背景
1.2 国内外相关研究动态
1.2.1 变量选择方法的研究动态
1.2.2 群组变量的研究动态
1.3 文章的内容及结构安排
第2章 相关理论基础
2.1 部分线性模型
2.2 线性模型下变量选择方法
2.3 群组变量选择方法
2.4 SIS筛选方法
2.5 本章小结
第3章 部分线性模型下ADS方法的渐近正态性
3.1 引言
3.2 部分线性模型下ADS估计的定义
3.3 ADS估计的渐近正态性
3.4 数值模拟
3.5 外卖数据分析
3.6 本章小结
第4章 群组变量GADS方法的渐近正态性
4.1 引言
4.2 GADS方法的定义
4.3 GADS估计的渐近正态性
4.4 店铺数据分析
4.5 本章小结
第5章 基于复杂群组下的S-GADS方法
5.1 引言
5.2 复杂群组下新的GADS方法
5.3 降维筛选S-GADS方法
5.4 数值模拟
5.5 本章小结
结论与展望
参考文献
致谢
攻读学位期间论文发表情况
【参考文献】:
期刊论文
[1]纵向数据下部分线性模型基于经验似然的变量选择[J]. 于卓熙,李梦丽. 吉林大学学报(理学版). 2018(04)
[2]改进的强相关数据的变量选择方法[J]. 徐若南,唐烁,王旭辉. 大学数学. 2017(01)
[3]基于惩罚方法的贝叶斯群组变量选择[J]. 牟建波,刘赪. 绵阳师范学院学报. 2017(02)
[4]高维数据下群组变量选择的惩罚方法综述[J]. 王小燕,谢邦昌,马双鸽,方匡南. 数理统计与管理. 2015(06)
[5]大数据时代的高维统计:稀疏建模的发展及其应用[J]. 李仲达,林建浩,王美今. 统计研究. 2015(10)
[6]Logistic回归的双层变量选择研究[J]. 王小燕,方匡南,谢邦昌. 统计研究. 2014(09)
[7]线性回归模型中变量选择方法综述[J]. 王大荣,张忠占. 数理统计与管理. 2010(04)
博士论文
[1]若干高维模型变量选择和模型重建问题的研究[D]. 盖玉洁.山东大学 2011
[2]经验似然纵向数据和似然Dantzig Selector方法[D]. 胡爽.山东大学 2011
[3]非参和半参回归模型的稳健和截面推断[D]. 李锋.山东大学 2010
硕士论文
[1]超高维数据部分线性模型的变量选择[D]. 李冰月.北京工业大学 2017
[2]基于Group SCAD的组变量选择[D]. 郭骁.西北大学 2016
[3]几类回归模型中的变量选择方法[D]. 刘琳.广西大学 2013
本文编号:3319611
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3319611.html