基于Canopy的高维样本相似性度量及分组加权t-SNE改进算法
发布时间:2021-03-11 20:41
随着数据规模的增大和数据复杂度的增加,高维数据的处理技术要求越来越高。其中高维数据的降维对于实现分类聚类、时序预测和关联性分析等有着重要意义。高维降维技术一般包括线性降维和非线性降维两种,其中t分布随机邻域嵌入(t-distributed stochastic neighbor embedding,t-SNE)算法是一种应用较为广泛的非线性降维方法,它的原理是计算高维空间内样本对之间的联合概率并与低维空间内样本对的联合概率进行匹配,从而实现数据从高维空间到低维空间的映射。在目前的研究中,由于在该算法的实现过程中研究人员较少考虑高维空间内样本间的实际分布状态,即无论高维空间内样本相似程度如何,都采用同一种概率算法,这影响了低维映射结果的区分度,使得聚类效果结果不够理想。针对这一问题,本文提出了一种基于Canopy的分组加权t-SNE算法,该算法首先对高维空间内样本的分布情况进行分析,使用Canopy算法进行高维样本相似程度的度量,在此基础上将高维空间样本的相似程度分为高相似程度、适中相似程度和低相似程度三组,并分别进行自适应加权后再计算高维空间内样本点之间的高维联合概率,从而更准确地反映...
【文章来源】:昆明理工大学云南省
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
Canopy算法原理
Canopy算法步骤图
高维空间中距离映射及Canopy分组结果图
【参考文献】:
期刊论文
[1]基于t分布邻域嵌入算法的流式数据自动分群方法[J]. 孟晓辰,王玥,祝连庆. 生物医学工程学杂志. 2018(05)
[2]t-SNE+LDA算法在仿生嗅觉中的应用研究[J]. 郑首易,骆德汉,温腾腾,何家峰. 计算机应用研究. 2018(11)
[3]Canopy-Kmeans聚类和组合优化的铁矿预配料智能调度[J]. 曹跃,王雅琳,何海明,杨卜菘,桂卫华. 控制理论与应用. 2017(07)
[4]稀疏保持典型相关分析特征选择与模式识别[J]. 许洁,吴秦,梁久祯,王念兵,张淮. 小型微型计算机系统. 2017(08)
[5]基于t-SNE的脑网络状态观测矩阵降维方法研究[J]. 董迎朝,王彬,马洒洒,刘辉,熊新,薛洁. 计算机工程与应用. 2018(01)
[6]自适应邻域值选取的LLE算法研究[J]. 高洁,吴立锋,关永,王洪民. 小型微型计算机系统. 2017(02)
[7]基于同步多维数据流的脑网络动态特征辨识方法研究[J]. 马洒洒,王彬,薛洁,董迎朝,刘辉,熊新. 计算机应用研究. 2017(11)
[8]基于t分布随机邻域嵌入的阿尔茨海默症诊断模型[J]. 成超,杨晨晖. 厦门大学学报(自然科学版). 2017(01)
[9]基于最近邻的随机非线性降维[J]. 田守财,孙喜利,路永钢. 计算机应用. 2016(02)
[10]基于子图选择和图核降维的脑网络分类方法[J]. 王立鹏,费飞,接标,张道强. 计算机科学与探索. 2014(10)
博士论文
[1]面向高维数据的特征学习理论与应用研究[D]. 路梅.苏州大学 2016
[2]基于磁共振成像的脑连接方法学及应用研究[D]. 廖伟.电子科技大学 2011
硕士论文
[1]基于随机初始化的非线性降维算法的研究[D]. 田守财.兰州大学 2016
[2]基于复杂网络的脑功能研究与分析[D]. 乔赫元.中国科学技术大学 2011
本文编号:3077061
【文章来源】:昆明理工大学云南省
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
Canopy算法原理
Canopy算法步骤图
高维空间中距离映射及Canopy分组结果图
【参考文献】:
期刊论文
[1]基于t分布邻域嵌入算法的流式数据自动分群方法[J]. 孟晓辰,王玥,祝连庆. 生物医学工程学杂志. 2018(05)
[2]t-SNE+LDA算法在仿生嗅觉中的应用研究[J]. 郑首易,骆德汉,温腾腾,何家峰. 计算机应用研究. 2018(11)
[3]Canopy-Kmeans聚类和组合优化的铁矿预配料智能调度[J]. 曹跃,王雅琳,何海明,杨卜菘,桂卫华. 控制理论与应用. 2017(07)
[4]稀疏保持典型相关分析特征选择与模式识别[J]. 许洁,吴秦,梁久祯,王念兵,张淮. 小型微型计算机系统. 2017(08)
[5]基于t-SNE的脑网络状态观测矩阵降维方法研究[J]. 董迎朝,王彬,马洒洒,刘辉,熊新,薛洁. 计算机工程与应用. 2018(01)
[6]自适应邻域值选取的LLE算法研究[J]. 高洁,吴立锋,关永,王洪民. 小型微型计算机系统. 2017(02)
[7]基于同步多维数据流的脑网络动态特征辨识方法研究[J]. 马洒洒,王彬,薛洁,董迎朝,刘辉,熊新. 计算机应用研究. 2017(11)
[8]基于t分布随机邻域嵌入的阿尔茨海默症诊断模型[J]. 成超,杨晨晖. 厦门大学学报(自然科学版). 2017(01)
[9]基于最近邻的随机非线性降维[J]. 田守财,孙喜利,路永钢. 计算机应用. 2016(02)
[10]基于子图选择和图核降维的脑网络分类方法[J]. 王立鹏,费飞,接标,张道强. 计算机科学与探索. 2014(10)
博士论文
[1]面向高维数据的特征学习理论与应用研究[D]. 路梅.苏州大学 2016
[2]基于磁共振成像的脑连接方法学及应用研究[D]. 廖伟.电子科技大学 2011
硕士论文
[1]基于随机初始化的非线性降维算法的研究[D]. 田守财.兰州大学 2016
[2]基于复杂网络的脑功能研究与分析[D]. 乔赫元.中国科学技术大学 2011
本文编号:3077061
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3077061.html