基于黎曼流形优化的数据降维表达及应用
发布时间:2021-11-16 01:08
大数据时代,计算机和多媒体技术迅速发展,每时每刻都在生成大量的图像和视频数据。面对如此海量的数据,不仅有效识别它们已经成为一项巨大挑战,甚至简单的存储和读取都会存在困难。数据降维表达是解决数据存储、读取及识别等问题的一种重要手段。因此数据降维表达已成为人们广泛关注的课题,并取得了丰硕成果。传统的数据降维表达方法主要是基于欧氏空间进行建模和优化。在欧氏空间中处理一些具有约束的问题常常使用拉格朗日法或贪婪算法,而这些方法往往会导致次优解的生成。为了在数值计算中获得更精确的数值解,黎曼流形优化开辟了一个新的方向。采用黎曼流形优化有两个显著的优势:第一,对于许多具有黎曼几何结构约束的优化问题,通过黎曼流形上的优化可以更好地利用约束空间的几何结构,转化为黎曼流形上的无约束优化问题,从而获得更精确的数值解。第二,通过引入适当的度量,可以将某些欧氏空间中的非凸问题转化为黎曼流形上的凸问题,进而改善数值计算方法,获得全局最优解。鉴于黎曼流形优化的优势,本文研究黎曼流形上数据降维模型的建立和优化问题。论文的主要创新性工作包括以下几个方面:第一,针对黎曼流形优化算法使用函数一阶信息收敛速度慢的问题,本文提...
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:109 页
【学位级别】:博士
【部分图文】:
黎曼流形上的最速下降法Figure1-1ThesteepestdescentmethodonRiemannianmanifolds
图 1-2 二维主成分分析结构示意图Figure 1-2 The framework of 2DPCA1.2.2.1 基于主成分分析的降维表达真实数据常常具有高维度和信息冗余的特征。主成分分析(PrincipComponent Analysis,PCA)[19][20]是从具有噪声数据中提取低维特征的一种有效工具。主成分分析认为高维数据的本征信息蕴含在一个低维空间中,表现为低维特征,这个低维特征决定了高维数据的变化。主成分分析通过投影矩阵,把高维数据线性的映射到低维空间中,寻找低维本征信息。主成分分析一般基于最小重构误差和最大可分性建模,其出发点分别是低维数据保留最大量的高维数据的信息和低维数据具有最大的可分性。主成分分析广泛应用于图像分析[21][22]、模式识别[23][24]和机器学习领域[25]中。传统的主成分分析方法,主要针对向量化的数据。向量化虽然可以简化计算,但该过程可能导致数据的维度灾难,而且也必然破坏二维数据的结构,丢失二维数据中的结构信息。为了保持二维数据的结构信息,文献[26][27]中,作者提出了二维主成分分
8(c)图 1-3 关于 (a)多线性回归,(b)主成分回归,和(c)偏最小二乘回归的示意图Figure 1-3 The graphical representation of (a) Multiple linear regression, (b) Principlcomponent regression, and (c) Partial least square regression为了避免过拟合问题,稀疏偏最小二乘回归[78][79]关键的步骤是提取主成选取适当的参数对投影矩阵进行约束,使投影矩阵具有稀疏性,从而潜在分数据之间稀疏的线性组合。稀疏偏最小二乘回归对生物组学数据,光谱波长及定量分析中取得较好的效果。当数据 和 在欧氏空间中具有复杂的非线性回归关系时,偏最小二乘回
本文编号:3497877
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:109 页
【学位级别】:博士
【部分图文】:
黎曼流形上的最速下降法Figure1-1ThesteepestdescentmethodonRiemannianmanifolds
图 1-2 二维主成分分析结构示意图Figure 1-2 The framework of 2DPCA1.2.2.1 基于主成分分析的降维表达真实数据常常具有高维度和信息冗余的特征。主成分分析(PrincipComponent Analysis,PCA)[19][20]是从具有噪声数据中提取低维特征的一种有效工具。主成分分析认为高维数据的本征信息蕴含在一个低维空间中,表现为低维特征,这个低维特征决定了高维数据的变化。主成分分析通过投影矩阵,把高维数据线性的映射到低维空间中,寻找低维本征信息。主成分分析一般基于最小重构误差和最大可分性建模,其出发点分别是低维数据保留最大量的高维数据的信息和低维数据具有最大的可分性。主成分分析广泛应用于图像分析[21][22]、模式识别[23][24]和机器学习领域[25]中。传统的主成分分析方法,主要针对向量化的数据。向量化虽然可以简化计算,但该过程可能导致数据的维度灾难,而且也必然破坏二维数据的结构,丢失二维数据中的结构信息。为了保持二维数据的结构信息,文献[26][27]中,作者提出了二维主成分分
8(c)图 1-3 关于 (a)多线性回归,(b)主成分回归,和(c)偏最小二乘回归的示意图Figure 1-3 The graphical representation of (a) Multiple linear regression, (b) Principlcomponent regression, and (c) Partial least square regression为了避免过拟合问题,稀疏偏最小二乘回归[78][79]关键的步骤是提取主成选取适当的参数对投影矩阵进行约束,使投影矩阵具有稀疏性,从而潜在分数据之间稀疏的线性组合。稀疏偏最小二乘回归对生物组学数据,光谱波长及定量分析中取得较好的效果。当数据 和 在欧氏空间中具有复杂的非线性回归关系时,偏最小二乘回
本文编号:3497877
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3497877.html