协方差矩阵的广义几何型收缩估计
发布时间:2021-08-12 06:21
多元统计分析在现代科学研究中占有重要地位.而作为多元统计研究的核心问题,协方差矩阵的估计在理论和实际应用中都发挥了不可或缺的作用.随着高维数据的大量出现,经典的协方差估计方法不再适用.为了解决高维数据协方差矩阵估计的问题,学者们提出了很多新的估计方法.其中,收缩估计的方法广受欢迎,如Ledoit和Wolf(2004)的算术型收缩估计,Tong和Wang(2007)的几何型收缩估计.本文则是在黎曼流形的框架下,研究了一种广义渐近最优几何收缩协方差矩阵估计,黎曼框架的应用赋予几何估计新的解释,顺势将算术收缩估计和几何收缩估计用统一的方法来计算,同时协方差矩阵的估计不受任何分布的限制.本文主要内容安排如下.第一章论述了高维数据协方差矩阵估计的研究背景,研究意义,发展历程和研究现状.第二章在黎曼流形的框架下,赋予方差的几何型收缩估计新的含义;通过黎曼度量的平方损失函数得到收缩参数的具体形式,同时提出了两种渐近最优收缩参数的估计方法,解决了无分布限制情况下方差的估计问题.第三章通过正态情形和非正态情形的模拟,利用平均损失百分比相关改进(PRIAL)准则对新提出的估计方法进行了检测,结果表明两种方...
【文章来源】:浙江工商大学浙江省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
=700,=50时正态分布的PRIAL结果.
=800,=60时正态分布的PRIAL结果.
正态分布图3-3:=900,=70时正态分布的PRIAL结果.在样本正态分布情形下,估计量ΣLi的效果基本上与ΣOAS相同,这是因为估计量ΣLi是在正态分布假设条件下提出来的.同时在样本量很小的情况下,估计量ΣLi和ΣOAS的表现远好于ΣCon,然而随着/值的增加,ΣLi和ΣOAS的效率显著下降,速率远超过ΣCon的下降速率.图3-2和图3-3分别展现了由参数对(,)=(800,60),(900,70)生成的样本为正态分布的不同/所对应的PRIAL值.参数对的选择分别使得对所有的都有E(2)=40/3,90/7,Var(2)=2/9,9/49,这表明个真实的方差2,=1,2,...,之间不存在较大的差异,并且有∑=1(log21∑=1log2)2→∈(0,∞).其结果与图3-1相同.3.2非正态情形下的模拟分析本章第一节我们展示了正态情形下的模拟情况及估计量的表现,为了更好地说明本文所提出的估计量的优势,我们将对非正态情形的数据进行模拟分析.对于非正态的情形,我们分别选取均匀分布,拉普拉斯分布和混合分布三种情况.具体模拟过程如下.分别从均匀分布,拉普拉斯分布和混合分布中随机生成样本大小为50,100,200,500,1000,2000的样本各100个,这表明/分别等于0.05,0.1,0.2,0.5,1,2.对于均匀分布,~(0,);对于拉普拉斯分布,~Laplace(,);对于混合分布,~Gamma(1,1)+(1)Gamma(2,2).对任意分布,在第次模拟中,对于固定的样本大小,真实的方差是从形状参数为,尺度参数为的伽玛分布gamma(,)中抽取的.即,对每一组(,),我们从Gamma(,)中抽取个值21,...,2.图3-4给出了由参数为(,)=(700,50)生成的样本分别为均匀分布,拉普拉斯分布32
本文编号:3337768
【文章来源】:浙江工商大学浙江省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
=700,=50时正态分布的PRIAL结果.
=800,=60时正态分布的PRIAL结果.
正态分布图3-3:=900,=70时正态分布的PRIAL结果.在样本正态分布情形下,估计量ΣLi的效果基本上与ΣOAS相同,这是因为估计量ΣLi是在正态分布假设条件下提出来的.同时在样本量很小的情况下,估计量ΣLi和ΣOAS的表现远好于ΣCon,然而随着/值的增加,ΣLi和ΣOAS的效率显著下降,速率远超过ΣCon的下降速率.图3-2和图3-3分别展现了由参数对(,)=(800,60),(900,70)生成的样本为正态分布的不同/所对应的PRIAL值.参数对的选择分别使得对所有的都有E(2)=40/3,90/7,Var(2)=2/9,9/49,这表明个真实的方差2,=1,2,...,之间不存在较大的差异,并且有∑=1(log21∑=1log2)2→∈(0,∞).其结果与图3-1相同.3.2非正态情形下的模拟分析本章第一节我们展示了正态情形下的模拟情况及估计量的表现,为了更好地说明本文所提出的估计量的优势,我们将对非正态情形的数据进行模拟分析.对于非正态的情形,我们分别选取均匀分布,拉普拉斯分布和混合分布三种情况.具体模拟过程如下.分别从均匀分布,拉普拉斯分布和混合分布中随机生成样本大小为50,100,200,500,1000,2000的样本各100个,这表明/分别等于0.05,0.1,0.2,0.5,1,2.对于均匀分布,~(0,);对于拉普拉斯分布,~Laplace(,);对于混合分布,~Gamma(1,1)+(1)Gamma(2,2).对任意分布,在第次模拟中,对于固定的样本大小,真实的方差是从形状参数为,尺度参数为的伽玛分布gamma(,)中抽取的.即,对每一组(,),我们从Gamma(,)中抽取个值21,...,2.图3-4给出了由参数为(,)=(700,50)生成的样本分别为均匀分布,拉普拉斯分布32
本文编号:3337768
本文链接:https://www.wllwen.com/kejilunwen/yysx/3337768.html