面向多视图数据的降维与聚类算法研究
发布时间:2021-06-11 04:18
随着数据来源的多样化,拥有多种表达方式的多视图数据出现在各个应用场景中。这些多视图数据普遍维数较高,数据量较大,并且常常缺失标签信息,因此,对多视图数据以无监督方式进行学习,分析和挖掘其中潜藏的价值信息显得颇为重要。本文在大量阅读和理解前人工作的基础上,提出了几种面向多视图数据的降维与聚类算法,具体内容如下:(1)提出了一种面向多视图数据的近邻结构保持降维算法。该算法在每个视图上构造带权邻接图来反映样本之间的近邻关系,并构造任意两个视图间结构相似性约束表达。在此基础上,寻找联合嵌入低维子空间,使得原高维空间样本近邻关系在子空间内能够得到保持,并且视图间的结构具有相似性的约束。(2)提出了一种基于多核学习的在线加权多视图模糊聚类算法。该算法采用批处理形式,将整个数据集分割成多个数据块进行处理,并将前一个数据块的聚类结果带入下一个数据块中作为初始值,由最后一个数据块得到最终的聚类结果。针对每个数据块,算法借鉴多核学习方法,充分利用不同视图间的结构一致性和信息互补性原则,同时,设计出了聚类中心和聚类隶属度的在线更新模型,为多视图数据提供聚类划分和视图权重。(3)提出了两种基于多视图降维策略的...
【文章来源】:南京师范大学江苏省 211工程院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
图1.1多视图数据??对多视图数据进行降维是多视图研究方法中的一个层面
?是课程、教员、学生、项目以及职工。??在多视图Wine数据集和Texas数据集的视图1上,随机选定原空间中某一??样本点并用蓝色矩形表示,其最近邻居节点用红色菱形表示,剩余样本均用绿色??表示,子空间中同样如此。为了增强实验效果,对样本点以及邻居节点尺寸进行??了放大处理。首先,取两个数据集原始空间视图1上前两个维度在二维空间下的??可视化结果,如图3.1a和3.2a所示。其次,在数据集视图1上运行MPVD算法,??将子空间维数设置为2后,得到二维空间下的可视化结果,如图3.1b和3.2b所??/Jn?〇???5-??-e-????卜.?、.,,、>?*?.7-?'?丫、???lr?-8?-??!:?H..,?^??|卜?*?-10-??>11 ̄iti^ ̄^ ̄ ̄ ̄^^.05?0?0.06?0.1?0.1S?0.2?0.25?0.3?0.35?0.4??(3)原视图1中某邻近两点?(b>子空间内分布??图3.1?Wine数据集上某样本点近邻结构分布示意图??由图3.1a可以观察到
子空间中同样如此。为了增强实验效果,对样本点以及邻居节点尺寸进行??了放大处理。首先,取两个数据集原始空间视图1上前两个维度在二维空间下的??可视化结果,如图3.1a和3.2a所示。其次,在数据集视图1上运行MPVD算法,??将子空间维数设置为2后,得到二维空间下的可视化结果,如图3.1b和3.2b所??/Jn?〇???5-??-e-????卜.?、.,,、>?*?.7-?'?丫、???lr?-8?-??!:?H..,?^??|卜?*?-10-??>11 ̄iti^ ̄^ ̄ ̄ ̄^^.05?0?0.06?0.1?0.1S?0.2?0.25?0.3?0.35?0.4??(3)原视图1中某邻近两点?(b>子空间内分布??图3.1?Wine数据集上某样本点近邻结构分布示意图??由图3.1a可以观察到,原始空间Wine数据集视图1上,用蓝色矩形表示的??某样本点与红色菱形表示的最近邻居节点其相对位置比较接近。在运行MPVD??算法后的子空间内,由图3.1b可以观察到,蓝色矩形表示的某样本点与红色菱??形表示的最近邻居节点其相对位置也十分贴近。由于样本点是随机选取的,因此??可以判定在Wine数据集上,原空间中样本点的近邻关系在子空间中得到了保持。??4厂??3??3??2??2?jj:.??11?”?
【参考文献】:
期刊论文
[1]利用正则化矩阵分解技术的多视图聚类方法[J]. 徐霜,余琍. 计算机工程与应用. 2019(14)
[2]Locality preserving projection on SPD matrix Lie group: algorithm and analysis[J]. Yangyang LI,Ruqian LU. Science China(Information Sciences). 2018(09)
[3]基于在线聚类的协同作弊团体识别方法[J]. 孙勇,谭文安,金婷,周亮广. 计算机研究与发展. 2018(06)
[4]基于滑动窗口的分布式轨迹流聚类[J]. 毛嘉莉,陈鹤,宋秋革,金澈清,周傲英. 计算机学报. 2018(09)
[5]一种改进的多视图聚类集成算法[J]. 邓强,杨燕,王浩. 计算机科学. 2017(01)
[6]基于多视图融合的蛋白质功能模块检测方法[J]. 张媛,贾克斌,ZHANG Aidong. 电子学报. 2014(12)
[7]联机核模糊C均值聚类方法[J]. 吴小燕,陈松灿. 系统工程与电子技术. 2012(12)
[8]MVP:基于CCA的多视图数据相关性预测方法[J]. 卜道成,陈飞,纪传舜. 计算机应用与软件. 2011(08)
博士论文
[1]基于多视图鉴别特征学习的分类算法[D]. 李晋.中国矿业大学(北京) 2016
硕士论文
[1]基于不完整视图的多核谱聚类算法及分布式实现[D]. 张薇.西南交通大学 2018
[2]基于划分模型的多视图聚类算法研究[D]. 张屹然.南京师范大学 2018
[3]基于矩阵分解的多视图降维方法研究[D]. 张晓语.西安电子科技大学 2017
[4]基于多核学习的多视图增量聚类模型研究[D]. 张佩瑞.西南交通大学 2017
[5]基于非负矩阵分解的多视图聚类方法研究[D]. 石锦辉.兰州大学 2017
[6]多视图学习研究及其算法改进[D]. 刘彦勋.西安电子科技大学 2015
本文编号:3223800
【文章来源】:南京师范大学江苏省 211工程院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
图1.1多视图数据??对多视图数据进行降维是多视图研究方法中的一个层面
?是课程、教员、学生、项目以及职工。??在多视图Wine数据集和Texas数据集的视图1上,随机选定原空间中某一??样本点并用蓝色矩形表示,其最近邻居节点用红色菱形表示,剩余样本均用绿色??表示,子空间中同样如此。为了增强实验效果,对样本点以及邻居节点尺寸进行??了放大处理。首先,取两个数据集原始空间视图1上前两个维度在二维空间下的??可视化结果,如图3.1a和3.2a所示。其次,在数据集视图1上运行MPVD算法,??将子空间维数设置为2后,得到二维空间下的可视化结果,如图3.1b和3.2b所??/Jn?〇???5-??-e-????卜.?、.,,、>?*?.7-?'?丫、???lr?-8?-??!:?H..,?^??|卜?*?-10-??>11 ̄iti^ ̄^ ̄ ̄ ̄^^.05?0?0.06?0.1?0.1S?0.2?0.25?0.3?0.35?0.4??(3)原视图1中某邻近两点?(b>子空间内分布??图3.1?Wine数据集上某样本点近邻结构分布示意图??由图3.1a可以观察到
子空间中同样如此。为了增强实验效果,对样本点以及邻居节点尺寸进行??了放大处理。首先,取两个数据集原始空间视图1上前两个维度在二维空间下的??可视化结果,如图3.1a和3.2a所示。其次,在数据集视图1上运行MPVD算法,??将子空间维数设置为2后,得到二维空间下的可视化结果,如图3.1b和3.2b所??/Jn?〇???5-??-e-????卜.?、.,,、>?*?.7-?'?丫、???lr?-8?-??!:?H..,?^??|卜?*?-10-??>11 ̄iti^ ̄^ ̄ ̄ ̄^^.05?0?0.06?0.1?0.1S?0.2?0.25?0.3?0.35?0.4??(3)原视图1中某邻近两点?(b>子空间内分布??图3.1?Wine数据集上某样本点近邻结构分布示意图??由图3.1a可以观察到,原始空间Wine数据集视图1上,用蓝色矩形表示的??某样本点与红色菱形表示的最近邻居节点其相对位置比较接近。在运行MPVD??算法后的子空间内,由图3.1b可以观察到,蓝色矩形表示的某样本点与红色菱??形表示的最近邻居节点其相对位置也十分贴近。由于样本点是随机选取的,因此??可以判定在Wine数据集上,原空间中样本点的近邻关系在子空间中得到了保持。??4厂??3??3??2??2?jj:.??11?”?
【参考文献】:
期刊论文
[1]利用正则化矩阵分解技术的多视图聚类方法[J]. 徐霜,余琍. 计算机工程与应用. 2019(14)
[2]Locality preserving projection on SPD matrix Lie group: algorithm and analysis[J]. Yangyang LI,Ruqian LU. Science China(Information Sciences). 2018(09)
[3]基于在线聚类的协同作弊团体识别方法[J]. 孙勇,谭文安,金婷,周亮广. 计算机研究与发展. 2018(06)
[4]基于滑动窗口的分布式轨迹流聚类[J]. 毛嘉莉,陈鹤,宋秋革,金澈清,周傲英. 计算机学报. 2018(09)
[5]一种改进的多视图聚类集成算法[J]. 邓强,杨燕,王浩. 计算机科学. 2017(01)
[6]基于多视图融合的蛋白质功能模块检测方法[J]. 张媛,贾克斌,ZHANG Aidong. 电子学报. 2014(12)
[7]联机核模糊C均值聚类方法[J]. 吴小燕,陈松灿. 系统工程与电子技术. 2012(12)
[8]MVP:基于CCA的多视图数据相关性预测方法[J]. 卜道成,陈飞,纪传舜. 计算机应用与软件. 2011(08)
博士论文
[1]基于多视图鉴别特征学习的分类算法[D]. 李晋.中国矿业大学(北京) 2016
硕士论文
[1]基于不完整视图的多核谱聚类算法及分布式实现[D]. 张薇.西南交通大学 2018
[2]基于划分模型的多视图聚类算法研究[D]. 张屹然.南京师范大学 2018
[3]基于矩阵分解的多视图降维方法研究[D]. 张晓语.西安电子科技大学 2017
[4]基于多核学习的多视图增量聚类模型研究[D]. 张佩瑞.西南交通大学 2017
[5]基于非负矩阵分解的多视图聚类方法研究[D]. 石锦辉.兰州大学 2017
[6]多视图学习研究及其算法改进[D]. 刘彦勋.西安电子科技大学 2015
本文编号:3223800
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3223800.html