在线社交网络用户身份匹配算法研究
发布时间:2020-05-28 11:31
【摘要】:随着互联网技术的日益发展,在线社交网络吸引了越来越多的注册用户,同时也呈现出多样化的趋势。在线社交网络的多样化在极大丰富了用户网络生活的同时,也使用户的身份信息碎片化。在线社交网络用户身份匹配就是将属于现实生活中同一个用户的多个社交网络账号进行匹配,从而实现多个在线社交网络的用户信息整合的一种技术,在商品推荐、用户信息关联以及网络安全领域有着十分重要的意义。当前,在线社交网络用户身份匹配的相关研究已经取得很大进展,但仍然存在以下不足:(1)当前基于网络结构信息的用户身份匹配算法难以表达网络中的高阶结构信息,同时缺少对其他维度信息的利用导致准确率不高。(2)当前基于用户档案信息的用户身份匹配算法在融合多属性信息时,往往由于采用主观赋值客观修正的权值分配方法导致算法鲁棒性不强,并且没有考虑各属性之间的隐含关系。(3)基于用户时空轨迹信息的用户身份匹配算法对位置访问顺序特征的提取能力较弱,难以准确描述时空轨迹特征。针对以上问题,本文分别基于在线社交网络中的网络结构信息、用户档案信息和用户时空轨迹数据提出了三种用户身份匹配算法。主要内容包括:(1)提出一种基于网络表示学习的用户身份匹配算法,以网络结构信息为主,同时结合用户名属性信息进行用户身份匹配。由于网络表示学习技术能够以较低的计算复杂度表达网络的高阶结构信息,可以弥补传统算法计算复杂度高、难以胜任高阶节点信息计算的缺陷,因此算法引入网络表示学习技术。在此基础上融合用户名属性信息,得到结合了网络结构信息和用户名信息的账号向量表示,并通过计算向量相似度判定匹配账号。在两组真实社交网络数据集上的实验结果表明,算法的综合性能与基准算法相比有所提升。(2)提出一种基于模糊积分理论的档案信息融合用户身份匹配算法。从用户档案信息出发,解决用户身份匹配问题。模糊积分理论提供一种档案信息融合的方法,为属性合理分配权值,可以在一定程度上解决现有算法在属性权值分配时鲁棒性不强的问题。算法引入模糊测度理论和离散Choquet积分,首先为用户档案信息中的不同属性分配不同的相似度计算策略;其次利用粒子群优化算法为用户档案信息中的每种属性计算模糊测度并作为属性权值;最后利用Choquet积分计算账号之间的相似度并以此判定匹配账号。在三组真实社交网络数据集中的实验结果表明,相比传统算法,本算法综合性能指标提升了3.89%-25.6%,验证了算法的有效性。(3)提出一种基于时空轨迹顺序特征表示的用户身份匹配算法。从用户行为信息中的时空轨迹数据出发,解决用户身份匹配问题。算法引入循环神经网络结构,用来解决传统时空轨迹匹配算法对位置访问顺序特征提取能力较弱的问题。首先对轨迹数据进行预处理,将坐标数据转化为网格,同时将轨迹按时间粒度进行分割;其次利用word2vec算法挖掘轨迹点蕴含的语义信息;然后引入Bi-GRU模型提取轨迹序列中蕴含的位置访问顺序特征,计算出轨迹特征向量;最后通过计算轨迹向量相似度判定匹配账号。在两组以位置分享为主要功能的社交网络中进行的实验表明,该算法能提取轨迹顺序特征,有效提升算法的综合性能。
【图文】:
图 2.1 对有向图社交网络的简化举例:指在线社交网络账号在现实生活中的所有且一个真实用户在每个社交网络中最多拥有 ):是从账号到真实用户的映射,即 i u表:指跨网络的两个账号都对应同一个真实用不同的在线社交网络的账号。 ):指算法运行前,数据集中已知匹配的合,即 = X Yi j u , u , ,,其中Xiu 和Yju 是网络用户身份匹配):输入在线社交网络X 用户身份匹配算法得到的所有匹配账号的更1Xu3Xu5Yu3YuX Y YpYT
图 2.1 对有向图社交网络的简化举例用户):指在线社交网络账号在现实生活中的所有户,并且一个真实用户在每个社交网络中最多拥有映射 ):是从账号到真实用户的映射,即 i u表匹配):指跨网络的两个账号都对应同一个真实用属于不同的在线社交网络的账号。账号集 ):指算法运行前,数据集中已知匹配的账号集合,即 = X Yi j u , u , ,其中Xiu 和Yju 是匹社交网络用户身份匹配):输入在线社交网络X 了通过用户身份匹配算法得到的所有匹配账号的更X Y
【学位授予单位】:战略支援部队信息工程大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.08
本文编号:2685177
【图文】:
图 2.1 对有向图社交网络的简化举例:指在线社交网络账号在现实生活中的所有且一个真实用户在每个社交网络中最多拥有 ):是从账号到真实用户的映射,即 i u表:指跨网络的两个账号都对应同一个真实用不同的在线社交网络的账号。 ):指算法运行前,数据集中已知匹配的合,即 = X Yi j u , u , ,,其中Xiu 和Yju 是网络用户身份匹配):输入在线社交网络X 用户身份匹配算法得到的所有匹配账号的更1Xu3Xu5Yu3YuX Y YpYT
图 2.1 对有向图社交网络的简化举例用户):指在线社交网络账号在现实生活中的所有户,并且一个真实用户在每个社交网络中最多拥有映射 ):是从账号到真实用户的映射,即 i u表匹配):指跨网络的两个账号都对应同一个真实用属于不同的在线社交网络的账号。账号集 ):指算法运行前,数据集中已知匹配的账号集合,即 = X Yi j u , u , ,其中Xiu 和Yju 是匹社交网络用户身份匹配):输入在线社交网络X 了通过用户身份匹配算法得到的所有匹配账号的更X Y
【学位授予单位】:战略支援部队信息工程大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.08
【参考文献】
相关硕士学位论文 前1条
1 孟波;多社交网络用户身份识别算法研究[D];大连理工大学;2015年
本文编号:2685177
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2685177.html