面向大规模网络表示学习的度偏置采样算法研究
发布时间:2022-02-17 13:41
网络表示学习旨在将网络中的节点表示成低维、稠密的实值向量形式,并使所得向量具备表示和推理的能力,从而可直接作为特征,用于分类、预测以及可视化等经典的网络分析任务。传统网络表示学习方法利用矩阵分解进行数据降维,由于缺乏扩展性和普适性,已逐步被基于深度学习的新型方法所取代。基于深度学习的方法通常使用随机游走算法采集节点序列,并通过神经网络训练节点向量。然而,它们在采样时均忽略了真实网络的无标度特性,而对网络中所有节点采取全局一致的游走策略,使生成的样本存在大量冗余信息且无法准确地保留原始网络的拓扑结构,极大地限制了网络表示学习的效率和效果。因此,提出一种基于节点度偏置的可回溯的随机游走算法DiaRW。在均匀随机游走的基础上,首先引入基于节点度偏置的回溯机制,允许游走路径在高度节点处以一定的概率发生回溯,利用高度节点的枢纽性对拓扑结构进行更充分的提取;同时,设计一种基于节点中心性的变长策略取代定长的游走策略,减少随机游走在低度节点附近对冗余信息的采集。DiaRW算法充分利用真实网络的无标度特性,可以更高效且精准地提取原始网络的拓扑信息,从而有效地提高网络表示学习的效率和效果。实验结果表明,在...
【文章来源】:华中科技大学湖北省211工程院校985工程院校教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 论文组织结构
2 相关理论与关键技术
2.1 网络表示学习概述
2.2 DeepWalk基本原理
2.3 基于随机游走的节点采样
2.4 基于Skip-Gram的表示学习
2.5 本章小结
3 可回溯的变长随机游走采样
3.1 全局统一策略的局限性
3.2 基于节点度偏置的回溯机制
3.3 基于节点中心性的变长策略
3.4 可回溯的变长随机游走算法
3.5 本章小结
4 测试与分析
4.1 测试系统及环境
4.2 测试数据集及对比方法
4.3 节点多标签分类的测试结果及分析
4.4 链接预测的测试结果及分析
4.5 参数敏感性分析
4.6 扩展性测试
4.7 本章小结
5 总结与展望
5.1 工作总结
5.2 研究展望
致谢
参考文献
附录1 攻读硕士学位期间发表的论文
附录2 硕士期间参与的课题研究情况
【参考文献】:
期刊论文
[1]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
本文编号:3629500
【文章来源】:华中科技大学湖北省211工程院校985工程院校教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 论文组织结构
2 相关理论与关键技术
2.1 网络表示学习概述
2.2 DeepWalk基本原理
2.3 基于随机游走的节点采样
2.4 基于Skip-Gram的表示学习
2.5 本章小结
3 可回溯的变长随机游走采样
3.1 全局统一策略的局限性
3.2 基于节点度偏置的回溯机制
3.3 基于节点中心性的变长策略
3.4 可回溯的变长随机游走算法
3.5 本章小结
4 测试与分析
4.1 测试系统及环境
4.2 测试数据集及对比方法
4.3 节点多标签分类的测试结果及分析
4.4 链接预测的测试结果及分析
4.5 参数敏感性分析
4.6 扩展性测试
4.7 本章小结
5 总结与展望
5.1 工作总结
5.2 研究展望
致谢
参考文献
附录1 攻读硕士学位期间发表的论文
附录2 硕士期间参与的课题研究情况
【参考文献】:
期刊论文
[1]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
本文编号:3629500
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3629500.html