社交网络中基于矩阵补全的深度矩阵分解推荐算法研究
发布时间:2021-11-02 16:21
信息爆炸的时代,单纯使用搜索引擎获取信息的方式已然无法满足人们的日常所需。在互联网背景下诞生的推荐系统,通过研究人们的历史行为,主动向人们提供可能感兴趣的信息,很好地解决了这一难题。但传统的推荐算法普遍难以解决冷启动问题,并且受到数据稀疏性的影响较大。随着在线社交网络的兴起,研究者们开始将社交网络拓扑结构的影响加入到推荐算法的考虑过程之中,弥补了传统推荐算法的不足,这就是社交网络推荐。本文的工作主要分为两个部分:矩阵补全和深度社交矩阵分解。两者都是借助用户和用户之间的信任关系、用户和商品之间的交互行为,对用户特征和商品特征进行深度挖掘。矩阵补全在本文中的目标是对实验数据进行预处理,以避免传统推荐算法因基于数据随机丢失的前提而引起的计算偏差。在矩阵补全的基础上,考虑到算法兼顾显式评分和隐式反馈的重要性,本文提出了将深度矩阵分解方法扩展到社交网络推荐领域的处理框架。随着在线社交网络的快速发展,许多数据挖掘技术都开始把社交关系加入到推荐算法的考量范围之中。虽然已经有了大量的工作,但是大多数社交网络推荐算法都基于同一个假设——用户历史数据中的缺失值是随机丢失的,但在现实生活中这是很少见的情况。...
【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
长尾理论
华东师范大学硕士学位论文10图3基于兴趣图谱的关系图和基于社交图谱的关系图如上图所示,以信任关系为基础的兴趣图谱可以用有向图表示,其中节点集合为={,,…,},表示网络中的用户。节点之间的连边表示用户之间的信任关系,比如节点F和节点C之间的有向连边在新浪微博中就可以理解为用户F关注了用户C。当然,用户之间也可以互相信任,比如用户D和用户E就是互相信任的关系。在以有向图表示的兴趣图谱中,对于任一节点,我们定义:out():节点指向的节点集合,现实意义为用户信任的用户集合;in():指向节点的节点集合,现实意义为信任用户的用户集合。在图3中,以朋友关系为基础的社交图谱一般用无向图表示,这是因为在用户双方建立关系之前已经通过双方的确认。在以无向图表示的社交图谱中,对于任一节点,我们定义:Γ():节点所拥有的邻居节点数目,同时也是节点所拥有的连边数。在社交网络图中,每个节点都各有其邻居节点,也就是说,每位用户都各有其邻居用户,在这里可以理解为用户的朋友。与现实世界一样,同样是朋友,关系也有亲疏之别。下面将分别详细阐述节点亲疏关系在基于社交图谱的无向图和基于兴趣图谱的有向图中的计算过程。2.1.1基于社交图谱的无向图在基于社交图谱的无向图中,计算朋友之间的亲疏关系常用的有以下三种策略:a)公共邻居指标公共邻居指标[43]是最常见的基于局部的指标之一,其含义直观且容易理解。在现实生活中,如果两位用户有许多的共同好友,那么这两位用户的社交圈子一定有很大的重叠部分,自然可以推断,两人的兴趣爱好也十分类似。从现实映射到社交网络中也同样
华东师范大学硕士学位论文12可以解释为,用户A和用户B如果都与社交达人用户C存在朋友关系,并不足以认为两人的亲密度很高;而若用户A、B两人都与不擅交际的用户D交往甚密,则足以说明问题。2.1.2基于兴趣图谱的有向图相比基于社交图谱的无向图,计算基于兴趣图谱的有向图中两两用户之间的信任关系要相对复杂。首先,在计算信任度之前,在社交网络中还有以下两个需要了解的基本概念:跳数(hop):在计算机网络中,跳数表示在源和目标之间传递路径上所需中间设备的数量。把这个概念迁移到社交网络中,hop对应网络中从源节点到目标节点路径上的节点数目。最短路径长度:网络中任意两个节点之间的最短路径长度为两点间的全部路径中边数最小的通路长度,同时也等于两点间的最短跳数。在有向图中,由于用户之间的信任是单向传播,故用户之间的相似度无法用上述的公共邻居指标、Jaccard指标和AA指标来计算。大量研究表明,信任具有一定程度的可传递性,并且遵循一定的传播策略。在有向图中,模拟用户间信任传播的计算方式有很多种。在进行具体阐述之前首先给出如下定义::表示用户间的信任度,在图论中可理解为边的权值。其中为源节点,为目标节点,且取值范围为[0,1],的值越大,表示用户对用户越信任。以图4为例,用户B对用户A的信任度为0.6。=(,,):表示信任图。其中与的意义与2.2.1章节中所介绍的意义相同,表示边的权重的集合,也就是上述信任度的集合,公式化表示为{∈|,∈}。图4基于兴趣图谱的有向图示意图
本文编号:3472115
【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
长尾理论
华东师范大学硕士学位论文10图3基于兴趣图谱的关系图和基于社交图谱的关系图如上图所示,以信任关系为基础的兴趣图谱可以用有向图表示,其中节点集合为={,,…,},表示网络中的用户。节点之间的连边表示用户之间的信任关系,比如节点F和节点C之间的有向连边在新浪微博中就可以理解为用户F关注了用户C。当然,用户之间也可以互相信任,比如用户D和用户E就是互相信任的关系。在以有向图表示的兴趣图谱中,对于任一节点,我们定义:out():节点指向的节点集合,现实意义为用户信任的用户集合;in():指向节点的节点集合,现实意义为信任用户的用户集合。在图3中,以朋友关系为基础的社交图谱一般用无向图表示,这是因为在用户双方建立关系之前已经通过双方的确认。在以无向图表示的社交图谱中,对于任一节点,我们定义:Γ():节点所拥有的邻居节点数目,同时也是节点所拥有的连边数。在社交网络图中,每个节点都各有其邻居节点,也就是说,每位用户都各有其邻居用户,在这里可以理解为用户的朋友。与现实世界一样,同样是朋友,关系也有亲疏之别。下面将分别详细阐述节点亲疏关系在基于社交图谱的无向图和基于兴趣图谱的有向图中的计算过程。2.1.1基于社交图谱的无向图在基于社交图谱的无向图中,计算朋友之间的亲疏关系常用的有以下三种策略:a)公共邻居指标公共邻居指标[43]是最常见的基于局部的指标之一,其含义直观且容易理解。在现实生活中,如果两位用户有许多的共同好友,那么这两位用户的社交圈子一定有很大的重叠部分,自然可以推断,两人的兴趣爱好也十分类似。从现实映射到社交网络中也同样
华东师范大学硕士学位论文12可以解释为,用户A和用户B如果都与社交达人用户C存在朋友关系,并不足以认为两人的亲密度很高;而若用户A、B两人都与不擅交际的用户D交往甚密,则足以说明问题。2.1.2基于兴趣图谱的有向图相比基于社交图谱的无向图,计算基于兴趣图谱的有向图中两两用户之间的信任关系要相对复杂。首先,在计算信任度之前,在社交网络中还有以下两个需要了解的基本概念:跳数(hop):在计算机网络中,跳数表示在源和目标之间传递路径上所需中间设备的数量。把这个概念迁移到社交网络中,hop对应网络中从源节点到目标节点路径上的节点数目。最短路径长度:网络中任意两个节点之间的最短路径长度为两点间的全部路径中边数最小的通路长度,同时也等于两点间的最短跳数。在有向图中,由于用户之间的信任是单向传播,故用户之间的相似度无法用上述的公共邻居指标、Jaccard指标和AA指标来计算。大量研究表明,信任具有一定程度的可传递性,并且遵循一定的传播策略。在有向图中,模拟用户间信任传播的计算方式有很多种。在进行具体阐述之前首先给出如下定义::表示用户间的信任度,在图论中可理解为边的权值。其中为源节点,为目标节点,且取值范围为[0,1],的值越大,表示用户对用户越信任。以图4为例,用户B对用户A的信任度为0.6。=(,,):表示信任图。其中与的意义与2.2.1章节中所介绍的意义相同,表示边的权重的集合,也就是上述信任度的集合,公式化表示为{∈|,∈}。图4基于兴趣图谱的有向图示意图
本文编号:3472115
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3472115.html
最近更新
教材专著