基于异构信息网络嵌入的相似性度量研究与应用
发布时间:2023-06-18 00:30
由于异构信息网络(HIN)在数据异构性建模方面的灵活性,采用HIN来表征检索系统中的复杂和异构辅助数据,通过相似性度量来完成检索任务的方法受到广泛关注。目前,基于HIN的相似性度量方法一般是通过元路径来衡量节点的相似性。然而对于相同类型节点的相似性度量,基于HIN元路径的相似性方法存在一些问题:它们忽略了元路径中其他类型节点的相似性对目标类型节点相似性度量的影响。针对这一现状,本文提出了一种基于异构信息网络嵌入的相似性度量算法(Similarity Measure Based on Heterogenous Information Network Embedding,HNESim)。为了更好地嵌入异构信息网络,HNESim采用了改进的Deepwalk算法,设计了一种基于元路径的随机游走策略,通过节点类型过滤来生成有意义的网络嵌入节点序列。学习到的节点嵌入首先由融合函数进行变换,随后通过计算两个节点嵌入融合后的余弦值,来衡量两个节点之间的相似性。我们在科研项目管理数据上进行实验,并与经典的相似性度量算法PathSim进行对比。实验结果显示,HNESim算法的平均精度(MAP)比PathS...
【文章页数】:54 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 课题背景及意义
1.2 国内外研究现状
1.3 课题研究内容及重点
1.4 本文的组织结构
2 相关理论及技术概述
2.1 异构信息网络
2.2 网络嵌入技术
2.3 基于元路径的相似度量算法
2.4 本章小结
3 HNESim算法研究与设计
3.1 算法架构设计
3.2 网络嵌入学习
3.3 相似性度量
3.4 算法评估
3.5 本章小结
4 HNESim算法应用与测试
4.1 总体架构设计
4.2 数据预处理模块实现
4.3 人员相似度计算模块
4.4 合作者检索模块
4.5 模块测试
4.6 本章小结
5 总结与展望
5.1 论文总结
5.2 论文展望
致谢
参考文献
本文编号:3834433
【文章页数】:54 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 课题背景及意义
1.2 国内外研究现状
1.3 课题研究内容及重点
1.4 本文的组织结构
2 相关理论及技术概述
2.1 异构信息网络
2.2 网络嵌入技术
2.3 基于元路径的相似度量算法
2.4 本章小结
3 HNESim算法研究与设计
3.1 算法架构设计
3.2 网络嵌入学习
3.3 相似性度量
3.4 算法评估
3.5 本章小结
4 HNESim算法应用与测试
4.1 总体架构设计
4.2 数据预处理模块实现
4.3 人员相似度计算模块
4.4 合作者检索模块
4.5 模块测试
4.6 本章小结
5 总结与展望
5.1 论文总结
5.2 论文展望
致谢
参考文献
本文编号:3834433
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3834433.html