当前位置:主页 > 科技论文 > 软件论文 >

推荐系统中面向评分和文本数据挖掘的若干关键技术研究

发布时间:2021-10-07 05:34
  推荐系统是一种对数据进行处理,并利用数据创造全新价值的数据挖掘方法。通常来说,传统的推荐系统是利用已有的信息,例如用户对于物品的评分(ratings)、评论(reviews)、以及用户和物品自身的属性(attributes)等为用户推荐新的物品,从而为电商创造新的收益价值。传统的推荐系统通常以矩阵分解和协同过滤为基础,通过叠加上下文信息实现一个较好的推荐效果。然而,随着新技术的发展(深度学习等),传统的推荐系统方法陈旧、评价标准单一的特点被暴露出来,并严重影响了推荐系统和深度学习等新技术的结合。此外,随着硬件设备的飞速发展和移动互联网的广泛应用,获取数据已经不再是推荐系统的发展瓶颈。如何对于数据进行筛选整合、提高数据质量、过滤劣质数据,从而最大限度发挥推荐系统的能力已经成为了当下推荐系统研究的重点。因此,结合数据挖掘方法对于传统的推荐系统进行改进和优化,并与新技术(深度学习)进行有效结合是非常有必要的。新环境下,推荐系统的研究面临着如下的问题:1:推荐系统和深度学习的结合:文本分析和图像处理等传统技术已经在深度学习的浪潮中得到广泛发展。在利用深度学习技术的过程中,一个关键的问题是Emb... 

【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校

【文章页数】:132 页

【学位级别】:博士

【部分图文】:

推荐系统中面向评分和文本数据挖掘的若干关键技术研究


推荐系统结构图

生成图像,学习模型


图 2.1 深度学习模型最近,许多基于神经网络的模型已经蓬勃发展起来:多层感知机(MultilayerPerceptron)[54]作为神经网络最初的形式,是一种正向传播反向反馈的神经网络,在输入和输出层之间有较多的隐含层。MLP 是一种有效解决非线性问题的神经网络。Autoencoder[55]是一种重构输入层和输出层的神经网络,在传统的autoencoder 上产生了许多变种,其中 VAE(variationalauto-encoder)[56]被广泛应用在 embedding 上。在深度学习模型上,有两种模型已经被广泛应用:卷积神经网络(Convolutional Neural Network[57])和循环神经网络(Recurrent Neural Network[58])。其中,卷积神经网络[59]是一种能够有效处理大型图片的神经网络,利用神经元覆盖其周围的神经元,因此可以有效的去噪和生成图像。循环神经网络[58]是一种针对时空序列的神经网络,面向语音识别,文本分析等序列数据,具有很强[52]

矩阵,例子,物品,内积


图 3.1 一个利用内积的矩阵 Embedding 例子在这个例子中,矩阵 R 是隐式反馈评分矩阵,用户集合 U={u1,u2,u3},物品集合 I={i1,i2,i3}。评分矩阵内的 1 表示用户对于物品有反馈,0 表示没有反馈。我们使用内积来作为目标函数的度量,rui=pu.qi,然后将用户集合 U 和物品集合 I 全部映射到一个 3 维的隐向量空间内。P,Q 表示用户和物品的隐向量集合。这种传统的利用内积的 Embedding 结果如图 3.1 所示。利用向量内积通常会导致出现多种结果(取决于初始化的向量服从何种分布)。本章举出的例子就是一个普通的例子作为说明。如果我们利用 P,Q 作为结果,将评分矩阵 R 作为真实数据,并利用协同过滤进行推荐的话[72],会产生非常多的问题。首先,在隐空间内,利用向量内积作为度量,会导致三个隐向量之间的关系违背空间三角规则。我们将 P,Q 内的全部隐向量看作是 3 维空间内的点。而这


本文编号:3421454

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3421454.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a4bc4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com