基于异构网络联合嵌入的用户对齐技术研究
发布时间:2021-11-25 02:51
随着互联网的迅速发展,在人们的日常生活中,社交网络的重要程度也越来越高。人们通常会注册多个不同的社交网络账号以享受不同的社交网络的功能。用户对齐是指将多个社交网络中属于现实世界中同一自然人的不同账号进行对齐,从而将用户散布在多个网络中的碎片化信息进行整合,对网络安全、社交网络数据挖掘和商品推荐等领域都具有重要意义。现阶段关于用户对齐问题还存在缺陷:第一,很多用户对齐研究都将社交网络单独嵌入到向量空间中,损失了网络信息,无法有效挖掘网络间隐藏信息。第二,在用户属性的利用上,大多数用户对齐任务采用向量拼接的方式,无法有效地将网络结构与属性相结合。针对上述问题,本文采用异构网络联合嵌入的方式,开展了用户对齐方法的研究。主要研究如下:1.提出了基于知识图联合嵌入的用户对齐算法。首先,利用种子锚用户对集合增加正例数量,并使得种子锚用户对在嵌入空间中的距离更近;其次,提出了Near_K负采样方法,保证负例质量进而提升嵌入空间质量;紧接着,提出了结构相似度,充分考虑用户在网络结构上的相似性,并结合余弦相似度共同度量用户相似性;最后,采用基于自适应阈值的贪心匹配方法寻找潜在锚用户对,并将每轮迭代中新找...
【文章来源】:重庆邮电大学重庆市
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
跨网络用户对齐示例图[26]
重庆邮电大学硕士学位论文第2章相关理论基础11合嵌入的方式对两个社交网络同时嵌入到统一的低维向量空间中。如图2.2所示,图2.2网络联合嵌入示例图是网络联合嵌入的示例图,通过部分已知的对齐的种子锚用户对,将两个网络嵌入到统一的低维向量空间中。以种子锚用户对为桥梁,通过联合嵌入后,在嵌入空间中,锚用户对之间的距离很近,而非锚用户对的距离很远。2.3基于知识图嵌入的实体对齐技术2.3.1知识图谱Google公司于2012年提出了一种基于图的数据结构,即知识图谱(KnowledgeGraph)。在知识图谱中,图中的节点称为实体,边称为关系,且每个节点或每条边均可以有一种或多种属性。实体通常指的是现实世界中的存在的事物如地点、物品、人等等,关系则表示图谱中各个事物之间具有的某种联系。社交网络就是一个典型的知识图谱,图2.3就是一个社交网络知识图谱的示例图。图中的蓝色和黄色节点均表示实体,而各实体之间的边就是关系。知识图谱在具有关联信息的查询时有更好的效果,主要归功于其能够从语义层面理解查询意图。如今知识图谱的查询已经被应用于各大类搜索引擎,例如在Google搜索引擎的搜索框中输入科比·布莱恩特时,结果页面右侧就会显示科比·布莱恩特的各类信息如出生年月、出生地、职业、配偶等。
重庆邮电大学硕士学位论文第2章相关理论基础14复杂度低,且在实际的任务中取得了不俗成绩。但是TransE也存在处理一对多、多对多和多对一的关系时显得力不从心。图2.4TransE模型[32]2.TransHTransE对复杂关系的应对存在效果不佳的问题,因此Wang等人在2014年提出了TransH模型[34]。图2.5是TransH的示意图,其核心思想是在不同的关系中,都有一个不同的超平面rW和关系向量rl。TransH这么做的目的是为了使得在不同的关系中同一实体所代表的含义可以不同,而同一关系中的不同实体所代表的含义可以相同。对一个三元组h,r,t,TransH首先将头尾实体所对应的向量沿关系r所在超平面的法线rw方向投影,即:rThhrhrllwlw(2.4)rTttrtrllwlw(2.5)与TransE类似,TransH也定义了如下损失函数来优化向量空间:12/(,)||||rrrhrtLLfhtlll(2.6)图2.5TransH模型[32]
【参考文献】:
期刊论文
[1]图卷积神经网络综述[J]. 徐冰冰,岑科廷,黄俊杰,沈华伟,程学旗. 计算机学报. 2020(05)
[2]表示学习知识图谱的实体对齐算法[J]. 朱继召,乔建忠,林树宽. 东北大学学报(自然科学版). 2018(11)
[3]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
[4]基于用户名特征的用户身份同一性判定方法[J]. 刘东,吴泉源,韩伟红,周斌. 计算机学报. 2015(10)
硕士论文
[1]基于网络表征学习的异构社交网络对齐研究[D]. 王宁.太原理工大学 2018
本文编号:3517259
【文章来源】:重庆邮电大学重庆市
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
跨网络用户对齐示例图[26]
重庆邮电大学硕士学位论文第2章相关理论基础11合嵌入的方式对两个社交网络同时嵌入到统一的低维向量空间中。如图2.2所示,图2.2网络联合嵌入示例图是网络联合嵌入的示例图,通过部分已知的对齐的种子锚用户对,将两个网络嵌入到统一的低维向量空间中。以种子锚用户对为桥梁,通过联合嵌入后,在嵌入空间中,锚用户对之间的距离很近,而非锚用户对的距离很远。2.3基于知识图嵌入的实体对齐技术2.3.1知识图谱Google公司于2012年提出了一种基于图的数据结构,即知识图谱(KnowledgeGraph)。在知识图谱中,图中的节点称为实体,边称为关系,且每个节点或每条边均可以有一种或多种属性。实体通常指的是现实世界中的存在的事物如地点、物品、人等等,关系则表示图谱中各个事物之间具有的某种联系。社交网络就是一个典型的知识图谱,图2.3就是一个社交网络知识图谱的示例图。图中的蓝色和黄色节点均表示实体,而各实体之间的边就是关系。知识图谱在具有关联信息的查询时有更好的效果,主要归功于其能够从语义层面理解查询意图。如今知识图谱的查询已经被应用于各大类搜索引擎,例如在Google搜索引擎的搜索框中输入科比·布莱恩特时,结果页面右侧就会显示科比·布莱恩特的各类信息如出生年月、出生地、职业、配偶等。
重庆邮电大学硕士学位论文第2章相关理论基础14复杂度低,且在实际的任务中取得了不俗成绩。但是TransE也存在处理一对多、多对多和多对一的关系时显得力不从心。图2.4TransE模型[32]2.TransHTransE对复杂关系的应对存在效果不佳的问题,因此Wang等人在2014年提出了TransH模型[34]。图2.5是TransH的示意图,其核心思想是在不同的关系中,都有一个不同的超平面rW和关系向量rl。TransH这么做的目的是为了使得在不同的关系中同一实体所代表的含义可以不同,而同一关系中的不同实体所代表的含义可以相同。对一个三元组h,r,t,TransH首先将头尾实体所对应的向量沿关系r所在超平面的法线rw方向投影,即:rThhrhrllwlw(2.4)rTttrtrllwlw(2.5)与TransE类似,TransH也定义了如下损失函数来优化向量空间:12/(,)||||rrrhrtLLfhtlll(2.6)图2.5TransH模型[32]
【参考文献】:
期刊论文
[1]图卷积神经网络综述[J]. 徐冰冰,岑科廷,黄俊杰,沈华伟,程学旗. 计算机学报. 2020(05)
[2]表示学习知识图谱的实体对齐算法[J]. 朱继召,乔建忠,林树宽. 东北大学学报(自然科学版). 2018(11)
[3]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
[4]基于用户名特征的用户身份同一性判定方法[J]. 刘东,吴泉源,韩伟红,周斌. 计算机学报. 2015(10)
硕士论文
[1]基于网络表征学习的异构社交网络对齐研究[D]. 王宁.太原理工大学 2018
本文编号:3517259
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3517259.html