当前位置:主页 > 经济论文 > 经济管理论文 >

张量数据背景下的因子模型相关算法与应用研究

发布时间:2024-03-05 03:36
  在数据爆炸的时代背景下,数据呈现出高维复杂的特性,张量可以清晰完整地表述这类数据。传统统计学方法下张量数据的向量化处理会丢失大量的数据结构信息,同时可能造成维数灾难和过拟合现象。因子模型是一种用于处理相依型变量的经典统计模型,主要基于原始变量的相依关系实现少数几个的独立潜在因子的提取,从而实现高维数据的降维。已有不少文献考虑将因子模型应用于基因学、神经系统科学、经济学和金融学等高维数据分析领域,并通过实证分析说明了因子模型在高维数据降维层面的优越性。随着应用数据集规模的急剧扩大,统计机器学习正面临着前所未有的挑战:维度灾难、观察变量的强相依性和过拟合等问题。为了更好地处理解决这些挑战难题,高维稳健因子分析模型应运而生。故本文基于张量数据进行了因子模型理论和应用的相关拓展,这为处理张量数据提供了新的思路。在理论方面,文章提出了高维因子模型在三阶张量空间的拓展。首先,提出了三阶张量数据背景下的因子模型;其次,相较于传统的高维因子模型为张量因子模型增添了新的假设限制:张量切片相依性;再次,类比因子模型因子个数的估计,通过引入矩阵相似度给出张量个数的估计衡量指标:相似度系数比率的估计量R1和相...

【文章页数】:104 页

【学位级别】:硕士

【部分图文】:

图1-1?n-阶张量示意图??《中国学术期刊(光盘版)》电子杂志社编者注:文中涉及涵盖香港在内的“国家”均应为“国家(地区)”??,“country”?均应为?“country?(region)?”,“countries”?均应为?“countries?(regions)?”?〇??I??

图1-1?n-阶张量示意图??《中国学术期刊(光盘版)》电子杂志社编者注:文中涉及涵盖香港在内的“国家”均应为“国家(地区)”??,“country”?均应为?“country?(region)?”,“countries”?均应为?“countries?(regions)?”?〇??I??

制??染色体上的基因排列图谱为一项复杂的高维数据处理任务。??假定p表示变量个数,n表示样本数量,t表示时间维度。通常来说,数理统计直接研??究的是为nxp阶的矩阵型数据,当n或p趋于无穷时,该数据可称为超高维矩阵数据。若??将矩阵数据增加时间维度t,那么我们可以获取矩阵数据的高....


图2-2张量纤维示意图??

图2-2张量纤维示意图??

张量为低阶张量,以三阶张量为例,张量中的元素通常可表示为七#。图2-1为三阶张量??空间示意图,其中图(1)为三阶实数张量,图(2)为三阶实数单位张量。??^=7]????II??II?^?7?7??^?'?J?J??I?/>?^?^???[/?V.??々??々??j?=?l,-....


图2-1三阶张量示意图??

图2-1三阶张量示意图??

张量为低阶张量,以三阶张量为例,张量中的元素通常可表示为七#。图2-1为三阶张量??空间示意图,其中图(1)为三阶实数张量,图(2)为三阶实数单位张量。??^=7]????II??II?^?7?7??^?'?J?J??I?/>?^?^???[/?V.??々??々??j?=?l,-....


图2-3?张量切片示意图??

图2-3?张量切片示意图??

二、切片??对于三维张量,若固定其中的一个维度,只改变其中两个维度的下标,进而可以得??到许多特定方向的矩阵,即称为切片。其中c/Zu.,4.,;,.,。/1.^分别对应为水平切片、横向??切片和正面切片,具体如图2-3所示。??



本文编号:3919615

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/3919615.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d9b62***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com