非负矩阵分解与网络数据降维
发布时间:2022-02-18 21:41
随着现代科技的飞速发展,在社会生产生活的实践中,有越来越多的数据信息日复一日地被积累起来。网络结构数据作为一类重要的数据存储方式,在互联网等科技领域中发挥着重要的作用。如何准确高效地从网络结构数据中提取信息是摆在我们面前的一大挑战。本文选择了一类特殊的网络结构数据——学术期刊的引用网络作为研究对象,该网络具有两个值得研究的性质:一是有向性;二是高度稀疏性。有向网络相比无向网络更具立体的结构,不仅可能含有分类结构信息(学术期刊的类别划分问题),在局部上节点间还可能有序的关系(研究方向相近的学术期刊的排序问题);稀疏性在一定程度上降低了期刊引用网络结构的复杂度,适合作为一个初步的模型算法的试验对象。本文从考察这类网络数据的结构特征出发,建立起新的模型并通过合适的数据处理算法对数据进行降维处理,从而获得对复杂网络结构数据的直观认识。传统的网络数据降维算法的流程一般是将网络数据视为高维数据,通过一定的处理方法导出数据节点间的对称(类)度量矩阵,然后使用谱方法进行低维嵌入。而本文将从统计学的角度出发,设计一个以离散概率分布为基础的模型,使用该模型可以从杂志引用网络中提取出杂志的一个类似于概率分布...
【文章来源】:清华大学北京市211工程院校985工程院校教育部直属院校
【文章页数】:41 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
主要符号对照表
第1章 引言
1.1 问题背景
1.2 具体问题与研究现状
1.3 论文组织
第2章 基本方法介绍
2.1 基于特征值分解的降维算法
2.1.1 多维尺度度量-MDS
2.1.1.1 原理
2.1.1.2 算法实现
2.2 非负矩阵分解-NMF
2.2.1 原理
2.2.2 算法实现
第3章 数据与模型构建
3.1 数据
3.1.1 数据概述
3.1.2 预处理方法
3.2 模型
3.2.1 模型提出与假设
3.3 算法与模型改进
3.3.1 算法调整
3.3.2 模型改进
第4章 数值试验与结果
4.1 数据选取
4.2 小规模数值试验
4.2.1 数据概览
4.2.2 NMF与MDS算法结果比较
4.3 较大规模数值试验
4.3.1 数据准备
4.3.2 统计方法与NMF算法效果比较
4.3.3 弱先验信息下NMF算法的效果
第5章 总结
参考文献
致谢
个人简历、在学期间发表的学术论文与研究成果
本文编号:3631600
【文章来源】:清华大学北京市211工程院校985工程院校教育部直属院校
【文章页数】:41 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
主要符号对照表
第1章 引言
1.1 问题背景
1.2 具体问题与研究现状
1.3 论文组织
第2章 基本方法介绍
2.1 基于特征值分解的降维算法
2.1.1 多维尺度度量-MDS
2.1.1.1 原理
2.1.1.2 算法实现
2.2 非负矩阵分解-NMF
2.2.1 原理
2.2.2 算法实现
第3章 数据与模型构建
3.1 数据
3.1.1 数据概述
3.1.2 预处理方法
3.2 模型
3.2.1 模型提出与假设
3.3 算法与模型改进
3.3.1 算法调整
3.3.2 模型改进
第4章 数值试验与结果
4.1 数据选取
4.2 小规模数值试验
4.2.1 数据概览
4.2.2 NMF与MDS算法结果比较
4.3 较大规模数值试验
4.3.1 数据准备
4.3.2 统计方法与NMF算法效果比较
4.3.3 弱先验信息下NMF算法的效果
第5章 总结
参考文献
致谢
个人简历、在学期间发表的学术论文与研究成果
本文编号:3631600
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3631600.html