协方差矩阵的几何型收缩估计及其应用
发布时间:2020-10-17 12:19
协方差矩阵不仅刻画了各变量的离散程度,还刻画了变量间的线性相依关系,在多元统计分析中占据着重要的地位。例如,在总体主成分分析(或因子分析)中,根据协方差矩阵的特征根大小来挑选重要的主成分(或主要因子);在线性判别分析(LDA)中,判别函数包含有协方差矩阵;在探索性的数据分析和检验中,变量间的独立性和条件独立性关系采用协方差矩阵来度量;在置信区间的构建中也包含协方差矩阵。因此,对协方差矩阵的估计是一个非常重要的问题。众所周知,当总体的维数p很小时,样本协方差矩阵是总体协方差矩阵的优良估计(如相合估计,无偏估计,一致估计等)。但是随着总体的维数p逐渐增大,样本协方差矩阵变得越来越不稳定,样本协方差矩阵的最小特征根比总体协方差矩阵的最小特征根小得多,而最大特征根则大得多。其次,随着P逐渐增大,总体协方差矩阵的待估参数增加得很快(参数为O(p2)个)。待估参数增加,干扰的信息过多,导致估计误差的增大。这样,随着p的增大,样本协方差矩阵不再是总体协方差矩阵的良好估计。特别地,当总体的维数P大于样本的容量n,即pn时(此时对应的协方差矩阵的估计称为高维协方差矩阵估计),样本协方差矩阵是奇异的。通常,在理论研究和实际应用中,我们假设总体协方差矩阵是正定矩阵,这样,用一个奇异的矩阵来作为一个正定矩阵的估计明显是不合适的。总之,寻找高维协方差矩阵的优良估计在现代统计学中具有重要的理论意义和实践意义。高维总体协方差矩阵的估计问题是现代统计学中的核心问题,也是一个十分具有挑战意义的问题。近十多年来许多学者都致力于改善高维总体协方差矩阵的估计,提出了许多估计方法。常见的方法有正则化方法,收缩方法,在估计总体协方差矩阵时引入某种模型来描述变量之间的相关关系等方法。尽管这些特定方法具有很多优良性质,但是同时也存在着明显的缺陷。例如,banding方法和thresholding方法无法保持估计矩阵的正定性;tapering方法和thresholding方法在处理正定矩阵时计算非常复杂;对于存在先验结构的总体协方差矩阵,正则化方法和收缩方法都可能会改变原有矩阵的结构;引入某种模型来描述变量的关系则因为假设性太强而存在应用上的局限性。本文在Tong和Wang(2007)的基础上,系统地研究了一种新的估计总体协方差矩阵的方法—几何型收缩估计。该方法可以将banding方法,tapering方法,thresholding方法和算术型收缩估计统一到一种统一的框架进行研究。同时,得到的最终估计矩阵具有计算简单,保持正定性,保持先验结构等良好性质。本文研究高维总体协方差矩阵的几何型收缩估计及其在判别分析和资产投资组合中的应用。具体研究内容如下。第一章阐述本文的研究背景,综述高维协方差矩阵估计的研究历史和现状,并给出本文的研究内容。第二章给出本文所需的一些基础知识。涵盖以下三个方面的内容:首先是对几何平均值和算术平均值进行概述;其次是给出两个矩阵同时对角化的条件;最后介绍Hadamard积的符号表示及其性质。第三章研究对角型总体协方差矩阵∑ = diag(al1,…,σpp)的几何型收缩估计。首先,在最小化Log-Euclidean平方损失函数下得到最优收缩参数。其次,研究两种具体的目标矩阵下几何型收缩估计量和最优收缩参数的极限性质。其三,通过模拟验证几何型收缩估计的优良性。最后,通过传染病的数据进行实证分析。第四章研究一般正定的总体协方差矩阵∑=(σij)p×p 的几何型收缩估计。当pn时,由于样本协方差矩阵S不再是正定矩阵。我们对样本协方差矩阵施加一个扰动使之成为正定矩阵,然后构造出对应的几何型收缩估计,并在最小化Log-Euclidean平方损失函数下算出最优收缩参数。最后通过模拟来验证估计矩阵的优良性。第五章研究具有某些给定结构的正定的总体协方差矩阵∑ =(σij)p×p的几何型收缩估计。首先,在Hadamard积框架下提出带结构的协方差矩阵的几何型收缩估计量。其次,给出常见的目标矩阵。然后,在最小化Log-Euclidean平方损失函数下推导出最优收缩参数。最后通过模拟来验证估计矩阵的优良性。第六章研究对角型协方差矩阵的几何型收缩估计量在对角判别分析中的应用。首先介绍对角判别分析(DLDA)和二次判别分析(DQDA)的理论,然后将对角型总体协方差矩阵的几何型收缩估计量应用到对角判别分析(DLDA)和二次判别分析(DQDA)中,得到几何收缩对角判别分析方法(GDLDA)和几何收缩二次判别分析方法(GDQDA)。其次通过模拟分析,比较各种判别分析方法的优劣。最后应用colon基因数据验证各个判别分析方法的误判率。模拟和实证的结果表明,GDLDA和GDQDA在绝大部分情况下误判率最低。第七章研究一般正定的总体协方差矩阵的几何型收缩估计量在投资组合中的应用。首先对最小方差投资组合(GMVP)理论部分进行介绍,并利用一般正定的总体协方差矩阵的几何型收缩估计量得到投资组合的最优权重的解析解。其次,利用CSMAR下载的2015-2016年上证A股的数据,计算由算术收缩估计,几何收缩估计和样本协方差得到的投资组合的最优权重。将等权组合的收益作为基准值,比较各个投资组合的期望收益与基准值之间的差异。实证结果表明,几何型收缩估计在投资组合中更为有效。第八章为全文的主要结论和展望。归纳本文的主要工作和主要结论,并对未来研究进行展望。
【学位单位】:浙江工商大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:O212.4
【部分图文】:
样本容量固定时,平均绝对误差关于样本维数变化的趋势则在图??4.1-4.4中。取样本容量rz?=?10情况来观察平均绝对误差关于样本维数变化的趋??势图,具体结果展示在图4.1中。将三个平均误差分开来看,其具体图表展示为??图42-4.4。从图中可知,的值在逐渐减小,而M儿&和却趋于稳??定,其他的样本容量情况也是如此。由此可知,本文提出的几何型收缩估计量??随着样本维数的增加效果会越来越好。即在总体协方差矩阵为良态情形下,??的表现最优。??0???WE.3??-??T-??0??3??????〇?q?_??(0?r-??n<?B?8?5?1?1??c?W??S?°"??q?|?_?t?|??°?n?i?i?i?I??100?200?300?400?500??Sample?Dimension?p??图4.1情形A下平均绝对误差随样本维数的变化趋势图??从收缩参数来看,两个收缩参数都比较小,几何型最优收缩参数接近0。几??何型收缩估计量公G接近为S?+?W,其平均绝对误差最小。这说明增加了扰动参??54??
图4.2?随样本维数变化图??
?500??Sample?Size??图4.2?随样本维数变化图??-?|?一队;??P:\??s?S?_?"?,??〇? ̄I?I?I?I?I ̄??100?200?300?400?500?
【参考文献】
本文编号:2844766
【学位单位】:浙江工商大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:O212.4
【部分图文】:
样本容量固定时,平均绝对误差关于样本维数变化的趋势则在图??4.1-4.4中。取样本容量rz?=?10情况来观察平均绝对误差关于样本维数变化的趋??势图,具体结果展示在图4.1中。将三个平均误差分开来看,其具体图表展示为??图42-4.4。从图中可知,的值在逐渐减小,而M儿&和却趋于稳??定,其他的样本容量情况也是如此。由此可知,本文提出的几何型收缩估计量??随着样本维数的增加效果会越来越好。即在总体协方差矩阵为良态情形下,??的表现最优。??0???WE.3??-??T-??0??3??????〇?q?_??(0?r-??n<?B?8?5?1?1??c?W??S?°"??q?|?_?t?|??°?n?i?i?i?I??100?200?300?400?500??Sample?Dimension?p??图4.1情形A下平均绝对误差随样本维数的变化趋势图??从收缩参数来看,两个收缩参数都比较小,几何型最优收缩参数接近0。几??何型收缩估计量公G接近为S?+?W,其平均绝对误差最小。这说明增加了扰动参??54??
图4.2?随样本维数变化图??
?500??Sample?Size??图4.2?随样本维数变化图??-?|?一队;??P:\??s?S?_?"?,??〇? ̄I?I?I?I?I ̄??100?200?300?400?500?
【参考文献】
相关期刊论文 前1条
1 刘金;唐权华;余志斌;金炜东;;基于三维直方图降维和重建的快速最小误差阈值法[J];电子与信息学报;2014年08期
本文编号:2844766
本文链接:https://www.wllwen.com/kejilunwen/yysx/2844766.html