基于Group Lasso的稀疏主成分分析

发布时间:2021-01-31 01:58
  在处理高维数据时,由于过多引入变量会严重影响模型的预测精度和可解释性,因此如何从众多变量中准确筛选出对响应变量具有重要影响的自变量就显得格外重要。Tibshirani提出的Lasso方法通过惩罚函数对系数进行压缩来实现变量选择,因其良好的稀疏性和运算速度使之成为基本的变量选择方法之一。之后众多学者在Lasso方法的基础上提出了许多新的变量选择方法,其中Group Lasso是在考虑变量具有群组效应时对Lasso的一种推广。众所周知,主成分分析(PCA)通过使用少于变量个数的主成分来达到降维的目的,然而由于每一个主成分都是所有原始变量的线性组合,导致主成分的含义往往难以解释。稀疏主成分分析(SPCA)在PCA的基础之上,结合Lasso的惩罚函数实现主成分结果的稀疏性,大大提高了结果的可解释性。同时SPCA的思想也为PCA与变量选择之间构建了桥梁。考虑到SPCA及Group Lasso同Lasso之间的联系,我们将Group Lasso与SPCA合理结合,提出一种基于Group Lasso的稀疏主成分分析方法。本文第二章首先从几种经典的变量选择方法着手,介绍了这些方法的基本定义与性质。然后... 

【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:66 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景及意义
    1.2 文献综述
        1.2.1 变量选择方法
        1.2.2 稀疏主成分分析
    1.3 论文写作结构
第二章 变量选择方法
    2.1 最小二乘估计及性质
    2.2 岭回归
    2.3 Lasso
        2.3.1 Lasso的定义
        2.3.2 正交情形下的Lasso
    2.4 Group Lasso
        2.4.1 Group Lasso的定义
        2.4.2 Group Lasso的惩罚函数
        2.4.3 Group Lasso的求解
    2.5 Sparse Group Lasso
第三章 稀疏主成分分析
    3.1 主成分分析
        3.1.1 主成分分析的定义
        3.1.2 实例分析
    3.2 稀疏主成分分析
        3.2.1 稀疏主成分分析的定义
        3.2.2 数值解法
        3.2.3 实例分析
第四章 基于Group Lasso的稀疏主成分分析
    4.1 GSPCA的定义
    4.2 数值解法
    4.3 实证分析
    4.4 数值模拟
第五章 总结与展望
参考文献
致谢
附录A
学位论文评阅及答辩情况表


【参考文献】:
期刊论文
[1]基于fused惩罚的稀疏主成分分析[J]. 张波,刘晓倩.  统计研究. 2019(04)



本文编号:3010002

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3010002.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ef68c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com