纵向数据的维数折叠与充分变量选择

发布时间:2024-11-29 22:07
  纵向数据融合了截面和时间序列的信息,在生物学、医学、金融学和经济学等领域受到人们的广泛关注,而飞速发展的科技手段使人们常常能搜集到大型的纵向数据集,数据维数的膨胀给纵向数据的统计分析带来了很大的困难和挑战.充分维数折叠方法不仅能保持自变量的矩阵形式,而且不会损失回归信息,是对矩阵值型自变量进行有监督降维的一种有力手段.本文基于距离协方差函数提出了一种无模型的纵向数据充分维数折叠降维方法.当结构维数已知时,理论上证明了该降维准则能从总体上找到中心维数折叠子空间,即中心降维子空间,实现时间和变量两个维度的降维.在样本给定时,将降维方法转化为带约束的高维优化问题,理论上证明了中心维数折叠子空间的估计具有(?)-相合性.计算上,通过引入Kronecker乘积假定,将带约束的高维优化问题转为低维问题,能使用成熟的非线性优化算法快速求解.为确定结构维数,本文提出了一种BIC型的方法,并证明了结构维数确定的相合性.当自变量比较多时,为挑选出重要变量,本文借鉴惩罚的思想,提出了一种充分变量选择方法.不同于文献中已有的基于纵向数据的变量选择方法,该变量选择方法无须对模型进行假定,避免了因模型假定不恰当而无...

【文章页数】:77 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景与意义
    1.2 研究内容、方法与技术路线
    1.3 本文的创新点
    1.4 本文章节安排
第2章 文献综述与相关理论
    2.1 文献综述
    2.2 相关理论
        2.2.1 距离协方差(DCOV)
        2.2.2 纵向数据简介
        2.2.3 中心维数折叠子空间
        2.2.4 流形
    2.3 本章小结
第3章 纵向数据的充分维数折叠
    3.1 充分维数折叠降维方法
    3.2 大样本性质
    3.3 算法
    3.4 非平衡纵向数据的处理
    3.5 本章小结
第4章 纵向数据的充分变量选择
第5章 数值模拟
    5.1 数值模拟分析
        5.1.1 模拟1(连续型响应变量)
        5.1.2 模拟2(离散型响应变量)
    5.2 本章小结
第6章 实证分析
    6.1 数据预处理
    6.2 结果分析
    6.3 本章小结
第7章 总结与展望
    7.1 总结
    7.2 展望
参考文献
附录A 理论证明
附录B 实证分析数据预处理程序
致谢



本文编号:4012918

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/4012918.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户09a11***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com