考虑重叠社区效应的个性化推荐方法研究
发布时间:2021-12-24 06:24
信息过载是大数据时代的突出问题之一,通过个性化推荐缓解信息过载,提升用户体验,已经成为目前热门的研究领域。现有推荐方法多聚焦于用户和商品的交互数据,然而电子商务网站存在海量用户和商品,单一的用户-商品交互数据存在数据稀疏和“冷启动”问题。为了解决这些问题,研究人员考虑引入用户的在线社交关系辅助建模用户偏好。用户在社交活动中通常会加入多个社区,利用多社区构成的重叠社区建模用户偏好的研究目前较少。本文基于用户加入的重叠社区可以有效反应用户兴趣偏好这一事实,提出了一种考虑重叠社区效应的推荐方法。该方法通过用户的商品交互数据和重叠社区数据联合建模用户的兴趣偏好,同时利用在语义信息挖掘上表现突出的主题模型挖掘数据背后隐藏的兴趣主题。该方法通过将用户类比为文档、商品和社区类比为两类单词、用户的兴趣偏好类比为文档主题,将用户的商品购买决策过程转化为文档单词的生成过程,并基于主题模型原理建模用户的兴趣偏好。本文利用Gibbs抽样推断模型参数,根据模型参数计算商品对目标用户的效用值,取效用值较高的商品生成目标用户的推荐列表。最后,本文利用CiteUlike公开数据集比较、验证所提方法与几组经典的推荐方法...
【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
主题模型简单示意图
图 2.3 LDA 的概率图模型Fig 2.3 Probabilistic Graphical Model of LDA型图可以拆分为如下两个过程: ,这个过程表示在生成第 篇文档的然后根据这个分布生成了文档中第 个词 = ,这个过程表示从 个主题 的分布,然后生成词汇 。型中,M 篇文档会对应 M 个独立 Dirich应 K 个独立的 Dirichlet-Multinomial 共轭合, 是可以观察到的已知变量, 和量 、 和 都是未知的隐含变量,计的。根据 LDA 的图模型,我们可以写 ) = ( | ) ( |
图3.1 给出了概率图模型。模型及其后续推导中用到的符号及其含义见表 3.1。表 3.1 相关字符含义Tab 3.1 Description of notations used in the model符号 说明 用户集合、商品集合、社区集合 隐主题数量 不重复用户数量, = 不重复商品数量 = 不重复社区数量 = 第 个用户选择的商品数量 第 个用户选择的社区数量 狄利克雷先验参数 用户-兴趣主题多项式分布 兴趣主题-商品多项式分布 兴趣主题-社区多项式分布 第 个用户交互的第 个商品的主题 第 个用户的第 个社区的主题 商品 社区 ( )用户购买的商品中,商品属于主题 的个数 ( )不考虑当前需要更新兴趣主题的商品,用户购买的商品中,商品属于主题 的个数 即不考虑主题,用户够买的商品个数 ( )社区 在兴趣主题 下出现的次数 ( )不考虑当前需要更新兴趣主题的社区,社区 在兴趣主题 下出现的次数 主题 下分配的商品个数 ( )用户加入的社区中,社区属于主题 的个数 ( )不考虑当前需要更新兴趣主题的社区,户加入的社区中,社区属于主题 的个数 即不考虑主题
本文编号:3549978
【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
主题模型简单示意图
图 2.3 LDA 的概率图模型Fig 2.3 Probabilistic Graphical Model of LDA型图可以拆分为如下两个过程: ,这个过程表示在生成第 篇文档的然后根据这个分布生成了文档中第 个词 = ,这个过程表示从 个主题 的分布,然后生成词汇 。型中,M 篇文档会对应 M 个独立 Dirich应 K 个独立的 Dirichlet-Multinomial 共轭合, 是可以观察到的已知变量, 和量 、 和 都是未知的隐含变量,计的。根据 LDA 的图模型,我们可以写 ) = ( | ) ( |
图3.1 给出了概率图模型。模型及其后续推导中用到的符号及其含义见表 3.1。表 3.1 相关字符含义Tab 3.1 Description of notations used in the model符号 说明 用户集合、商品集合、社区集合 隐主题数量 不重复用户数量, = 不重复商品数量 = 不重复社区数量 = 第 个用户选择的商品数量 第 个用户选择的社区数量 狄利克雷先验参数 用户-兴趣主题多项式分布 兴趣主题-商品多项式分布 兴趣主题-社区多项式分布 第 个用户交互的第 个商品的主题 第 个用户的第 个社区的主题 商品 社区 ( )用户购买的商品中,商品属于主题 的个数 ( )不考虑当前需要更新兴趣主题的商品,用户购买的商品中,商品属于主题 的个数 即不考虑主题,用户够买的商品个数 ( )社区 在兴趣主题 下出现的次数 ( )不考虑当前需要更新兴趣主题的社区,社区 在兴趣主题 下出现的次数 主题 下分配的商品个数 ( )用户加入的社区中,社区属于主题 的个数 ( )不考虑当前需要更新兴趣主题的社区,户加入的社区中,社区属于主题 的个数 即不考虑主题
本文编号:3549978
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3549978.html