基于多场景会话数据的推荐技术研究与实现
发布时间:2021-11-14 18:38
随着互联网时代的到来和信息科技的进步,大数据时代所带来的信息过载的问题日益严重。用户很难从海量的图像、视频、文本和商品信息中找到适合自己个性化需求的信息。个性化推荐系统是一种解决信息过载的重要手段。与搜索引擎相比,推荐系统通过研究用户的历史行为数据,并基于统计分析对用户的兴趣和偏好进行建模,从而引导用户找到自己的信息需求,从而满足用户个性化推荐的需求。因此,这一技术已经被广泛地应用于以Web3.0技术为主的互联网平台上。跨域推荐的重点研究方向为研究领域间部分重叠的跨域推荐方法。同领域中的用户集合完全重叠和完全不重叠是两种极端情况,现实生活中,普遍存在的一种现象是不同领域间的用户集合存在部分重叠。现在很多网站都会提供其他网站账号登录的入口,依据此事实,就能够找到不同领域中的同一用户。此外,一些文章还通过实验证明了有信息重叠的这一小部分用户在每个领域中均和超过80%的物品都有过交互行为。使用这些信息作为域之间信息共享和迁移的桥梁是可靠并且有效的。本论文的研究背景是基于单系统多场景多元异构数据的信息系统,各个场景间的用户几乎相同,并且场景间可以使用会话数据作为桥梁,因此采用用户部分重叠的跨域...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
行为矩阵图
值分解是最基础的基于矩阵分解的用户向量与物品向量提取方法,SVD的核心算法基于以下理论:把矩阵A分解成=。给出×矩阵的数据A(n个用户,m个物品),可以获得一个×的矩阵U(n个用户,r个概念),一个×的对角矩阵R(概念的长度),R矩阵包含奇异值(奇异值总为正且降序排列),以及×的矩阵V(m个物品,r个概念)。U矩阵可以解释成用户概念相似矩阵,矩阵V则是物品概念相似性矩阵。每个U矩阵的行向量即为用户在SVD模型中得到的用户特征向量,每个V矩阵的列向量即为物品在SVD模型中得到的物品特征向量。一种典型矩阵分解模型框架如图3-2所示。通过参数和分别控制用户和物品的隐向量生成,得到用户隐向量U和物品隐向量V,同时X为附加侧信息,如物品的主题信息或词向量信息,最终将U域V做内积,得到评分R。图3-2矩阵分解模型矩阵分解方法应用与推荐问题的方式可以定义成为矩阵填充问题。通过设计一个稀疏矩阵,用户为行,物品位列。矩阵中每个已知元素代表用户对物品的偏好。如此,用户偏好预测问题可以简化为矩阵填充问题。基于此思想的一种方法是非负矩阵分解(NMF)[22],通过引入一个偏置项来是的预测的矩阵的缺失值均为正值。总的来说,矩阵分解模型是实现隐语义模型的一种途径,其目的是学习用户和物品的隐式特征向量,从而成为基础的用户向量与物品向量提取方法之一。在推荐系统领域内,矩阵分解可以解决一些近邻模型无法解决的问题。近邻模型存在的问题:1、物品之间存在相关性,信息量并不是随着向量维度增加而线性增加2、矩阵元素稀疏,计算结果不稳定,增减一个向量维度,导致紧邻结果差异很大的情况出现。假设系统有部电影,位用户,和从1到的整数评价值。表示用户对电影的评价,和是潜在的用户和电影特征矩阵,其中列向量和分别表示
数据的压缩和解压缩函数是模型从数据中相关的、有损的、从样本中自动学习的。在大部分自动编码器的应用场景下,进行数据压缩和解压缩的函数是通过深度神经网络实现的。通过自编码器可以同时学习用户和物品的隐式特征表示,利用学习到的隐特征表示来最小化训练数据的误差,学习物品隐特征表示。例如在推荐系统领域内,把物品作为输入序列,把用户作为商品的特征,通过编码与解码操作得到物品的隐式特征表示;把用户作为输入序列,把商品作为用户的特征,通过编码与解码操作得到用户的隐特征表示。一种典型的自动编码器结构如图3-3所示,该自动编码器拥有一个三层结构,包括输入层、隐藏层和输出层。图3-3自动编码器自编码器训练完成后,当有新的样本()输入到这个训练好的自编码器中后,那么隐藏层各单元的激活值组成的向量(1)=[1(1),2(1),…,(1)]就可以代表()(因为根据稀疏自编码,自编码器可以用(1)来恢复()),也就是说(1)=[1(1),2(1),…,(1)]就是()在新的特征下的特征值。每一个特征是使某一个(1)取最大值的输入。假设隐藏层单元有100个,那么就一共有100个特征,所以()新的特征向量(1)有100维。该特征向量所表示的特征称为一阶特征。通过不断叠加中间层,即可得到信息的高阶表示,即信息的高阶特征。即使自编码器可以学习信息的潜在表示,但在辅助信息非常稀疏的情况下,学习的潜在表示往往不够有效。因此,协同深度学习建立了一个层次贝叶斯模型。它使用堆叠去噪自编码器(SDAE)[22]代替LDA进行物品特征学习。然而,去噪自编码器(DAEs)实际上没有贝叶斯属性,DAEs的去噪方案实际上不是从概率的角度,而是从频率的角度。因此,这些模型难以进行贝叶斯推理,计算量大。协同变分自编码器(CV
【参考文献】:
期刊论文
[1]推荐系统研究综述[J]. 周万珍,曹迪,许云峰,刘滨. 河北科技大学学报. 2020(01)
[2]贵广网络智能推荐系统设计方案[J]. 曾敬鸿,朱迪,付守伟,陈丹,雷航,李赵宁. 有线电视技术. 2019(10)
[3]融合元数据及attention机制的深度联合学习推荐[J]. 张全贵,李志强,张新新,曹志强. 计算机应用研究. 2019(11)
[4]基于SVD++与标签的跨域推荐模型[J]. 邢长征,杨晓婷. 计算机工程. 2018(04)
[5]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[6]跨领域推荐技术综述[J]. 陈雷慧,匡俊,陈辉,曾炜,郑建兵,高明. 华东师范大学学报(自然科学版). 2017(05)
硕士论文
[1]基于评论和内容深度融合的跨域推荐问题研究[D]. 付文静.山东大学 2019
[2]基于跨域迁移学习的评分推荐研究[D]. 郑静.北京邮电大学 2018
[3]基于交叉用户的跨域推荐算法研究与实现[D]. 王游.西安电子科技大学 2017
本文编号:3495151
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
行为矩阵图
值分解是最基础的基于矩阵分解的用户向量与物品向量提取方法,SVD的核心算法基于以下理论:把矩阵A分解成=。给出×矩阵的数据A(n个用户,m个物品),可以获得一个×的矩阵U(n个用户,r个概念),一个×的对角矩阵R(概念的长度),R矩阵包含奇异值(奇异值总为正且降序排列),以及×的矩阵V(m个物品,r个概念)。U矩阵可以解释成用户概念相似矩阵,矩阵V则是物品概念相似性矩阵。每个U矩阵的行向量即为用户在SVD模型中得到的用户特征向量,每个V矩阵的列向量即为物品在SVD模型中得到的物品特征向量。一种典型矩阵分解模型框架如图3-2所示。通过参数和分别控制用户和物品的隐向量生成,得到用户隐向量U和物品隐向量V,同时X为附加侧信息,如物品的主题信息或词向量信息,最终将U域V做内积,得到评分R。图3-2矩阵分解模型矩阵分解方法应用与推荐问题的方式可以定义成为矩阵填充问题。通过设计一个稀疏矩阵,用户为行,物品位列。矩阵中每个已知元素代表用户对物品的偏好。如此,用户偏好预测问题可以简化为矩阵填充问题。基于此思想的一种方法是非负矩阵分解(NMF)[22],通过引入一个偏置项来是的预测的矩阵的缺失值均为正值。总的来说,矩阵分解模型是实现隐语义模型的一种途径,其目的是学习用户和物品的隐式特征向量,从而成为基础的用户向量与物品向量提取方法之一。在推荐系统领域内,矩阵分解可以解决一些近邻模型无法解决的问题。近邻模型存在的问题:1、物品之间存在相关性,信息量并不是随着向量维度增加而线性增加2、矩阵元素稀疏,计算结果不稳定,增减一个向量维度,导致紧邻结果差异很大的情况出现。假设系统有部电影,位用户,和从1到的整数评价值。表示用户对电影的评价,和是潜在的用户和电影特征矩阵,其中列向量和分别表示
数据的压缩和解压缩函数是模型从数据中相关的、有损的、从样本中自动学习的。在大部分自动编码器的应用场景下,进行数据压缩和解压缩的函数是通过深度神经网络实现的。通过自编码器可以同时学习用户和物品的隐式特征表示,利用学习到的隐特征表示来最小化训练数据的误差,学习物品隐特征表示。例如在推荐系统领域内,把物品作为输入序列,把用户作为商品的特征,通过编码与解码操作得到物品的隐式特征表示;把用户作为输入序列,把商品作为用户的特征,通过编码与解码操作得到用户的隐特征表示。一种典型的自动编码器结构如图3-3所示,该自动编码器拥有一个三层结构,包括输入层、隐藏层和输出层。图3-3自动编码器自编码器训练完成后,当有新的样本()输入到这个训练好的自编码器中后,那么隐藏层各单元的激活值组成的向量(1)=[1(1),2(1),…,(1)]就可以代表()(因为根据稀疏自编码,自编码器可以用(1)来恢复()),也就是说(1)=[1(1),2(1),…,(1)]就是()在新的特征下的特征值。每一个特征是使某一个(1)取最大值的输入。假设隐藏层单元有100个,那么就一共有100个特征,所以()新的特征向量(1)有100维。该特征向量所表示的特征称为一阶特征。通过不断叠加中间层,即可得到信息的高阶表示,即信息的高阶特征。即使自编码器可以学习信息的潜在表示,但在辅助信息非常稀疏的情况下,学习的潜在表示往往不够有效。因此,协同深度学习建立了一个层次贝叶斯模型。它使用堆叠去噪自编码器(SDAE)[22]代替LDA进行物品特征学习。然而,去噪自编码器(DAEs)实际上没有贝叶斯属性,DAEs的去噪方案实际上不是从概率的角度,而是从频率的角度。因此,这些模型难以进行贝叶斯推理,计算量大。协同变分自编码器(CV
【参考文献】:
期刊论文
[1]推荐系统研究综述[J]. 周万珍,曹迪,许云峰,刘滨. 河北科技大学学报. 2020(01)
[2]贵广网络智能推荐系统设计方案[J]. 曾敬鸿,朱迪,付守伟,陈丹,雷航,李赵宁. 有线电视技术. 2019(10)
[3]融合元数据及attention机制的深度联合学习推荐[J]. 张全贵,李志强,张新新,曹志强. 计算机应用研究. 2019(11)
[4]基于SVD++与标签的跨域推荐模型[J]. 邢长征,杨晓婷. 计算机工程. 2018(04)
[5]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[6]跨领域推荐技术综述[J]. 陈雷慧,匡俊,陈辉,曾炜,郑建兵,高明. 华东师范大学学报(自然科学版). 2017(05)
硕士论文
[1]基于评论和内容深度融合的跨域推荐问题研究[D]. 付文静.山东大学 2019
[2]基于跨域迁移学习的评分推荐研究[D]. 郑静.北京邮电大学 2018
[3]基于交叉用户的跨域推荐算法研究与实现[D]. 王游.西安电子科技大学 2017
本文编号:3495151
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3495151.html
最近更新
教材专著