面向推荐系统的机器学习算法研究
发布时间:2021-10-06 22:53
随着互联网信息的爆炸增长,互联网平台越来越依赖推荐系统对用户进行商品推荐。推荐系统可以帮助平台从海量信息中筛选出合适的内容,推送给用户,一方面帮助商家捕捉用户兴趣,另一方面也能满足用户个性化需求。推荐算法是推荐系统中的核心技术,研究推荐算法研究对于促进推荐系统在互联网平台中的有效应用具有重要意义。本文针对点击率预测推荐和排序学习推荐两个推荐场景中存在的问题,分别提出了新的点击率预测推荐模型和排序学习推荐算法。具体研究内容如下:(1)针对点击率预测推荐场景中已有推荐模型难以同时满足记忆与泛化功能、不能充分挖掘和组合低阶特征以及深度学习模型在推荐系统的高维稀疏数据集下模型参数难以学习且推荐结果过度泛化的问题,本文提出了一种基于梯度提升树和因子分解机的深度点击率预测模型,该模型结合了梯度提升树,因子分解机和深度神经网络,可同时实现记忆与泛化功能,可以充分挖掘低阶特征信息并自动实现低阶特征组合,可以在高维稀疏数据集上较好地学习模型参数,推荐结果也不再过度泛化。本文在大型竞赛平台数据集上进行了仿真实验,并对比了相关的点击率预测推荐模型。实验结果表明,本文所提模型在AUC(Area under R...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
推荐系统应用场景分类图
影响,使得最终的排序结果精准度不足。为了充分学习各种特征的权重,研究人员开始将机器学习模型引入到排序学习方法中。与传统排序方法不同的是,基于机器学习模型的排序方法是有监督学习算法,不依赖于手动设计的排序规则,而是通过训练集训练,自动学习出一种排序模型,使得该模型的预测排序与实际排序表现一致。同时,为了衡量这种排序关系的一致性,基于机器学习的排序学习方法不再使用绝对误差当作评价函数,而是使用一些位置敏感的评价函数,如平均准确率(MRR),平均倒数排名(MRR),归一化折损累计增益(NDCG)等等。图1-2信息检索示意图排序学习方法按照可以分为三类:基于单样本的方法(Point-wise),基于样本对的方法(Pair-wise)和基于样本列表的方法(List-wise)。下面将分别介绍这三种方法:1.基于单样本的方法只考虑了单样本的预测值,该方法将排序问题简化为了回归问题,将用户对商品的评分作为标签,通过训练使得预测评分与实际评分误差最小化,得到排序模型。如文献[26]提出的PRank模型;2.基于样本对的方法考虑了两两样本间的排序关系,它将已有的样本两两组合成样本对,使用样本对中两个样本的评分大小关系当作标签,如果样本对(a1,a2),如果用户对a1评分高于a2,那么将样本对标识为正例,否则标识为负例。模型预测时首先比较每两个样本间的偏序关系,再通过这种偏序关系复原全部样本的整
电子科技大学硕士学位论文12第二章推荐系统中的算法模型与相关概念推荐系统的本质是从海量内容中选取用户感兴趣的部分推荐给用户,工业界推荐系统框架一般分为召回(Recall)和推荐(Recommend)两部分,如图2-1所示。其中,召回是根据用户画像,商品自身特性等简单特征,通过规则匹配等方法为特定用户生成候选商品集合。推荐阶段会引入更加精细的特征,包括用户历史行为,用户和商品交互行为,用户上下文环境等特征,来决定为用户推荐哪些商品。由于这些特征较复杂,数据量也较大,难以人工衡量各个特征的重要性,在不同考虑维度中,各种特征的影响也不一样,故一般使用各种推荐算法和模型来学习特征的重要性,提升推荐的效果。针对具体的应用场景,推荐部分又可以分为点击率预测推荐和排序学习推荐。下面,本章将详细介绍这两个场景的定义及相关模型算法。图2-1推荐系统框架2.1点击率预测模型点击率预测推荐是根据用户和商品的特征预测用户对商品的点击概率,将用
【参考文献】:
期刊论文
[1]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[2]跨媒体分析与推理:研究进展与发展方向(英文)[J]. Yu-xin PENG,Wen-wu ZHU,Yao ZHAO,Chang-sheng XU,Qing-ming HUANG,Han-qing LU,Qing-hua ZHENG,Tie-jun HUANG,Wen GAO. Frontiers of Information Technology & Electronic Engineering. 2017(01)
[3]基于用户日志挖掘的搜索引擎广告效果分析[J]. 陈磊,刘奕群,茹立云,马少平. 中文信息学报. 2008(06)
本文编号:3420895
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
推荐系统应用场景分类图
影响,使得最终的排序结果精准度不足。为了充分学习各种特征的权重,研究人员开始将机器学习模型引入到排序学习方法中。与传统排序方法不同的是,基于机器学习模型的排序方法是有监督学习算法,不依赖于手动设计的排序规则,而是通过训练集训练,自动学习出一种排序模型,使得该模型的预测排序与实际排序表现一致。同时,为了衡量这种排序关系的一致性,基于机器学习的排序学习方法不再使用绝对误差当作评价函数,而是使用一些位置敏感的评价函数,如平均准确率(MRR),平均倒数排名(MRR),归一化折损累计增益(NDCG)等等。图1-2信息检索示意图排序学习方法按照可以分为三类:基于单样本的方法(Point-wise),基于样本对的方法(Pair-wise)和基于样本列表的方法(List-wise)。下面将分别介绍这三种方法:1.基于单样本的方法只考虑了单样本的预测值,该方法将排序问题简化为了回归问题,将用户对商品的评分作为标签,通过训练使得预测评分与实际评分误差最小化,得到排序模型。如文献[26]提出的PRank模型;2.基于样本对的方法考虑了两两样本间的排序关系,它将已有的样本两两组合成样本对,使用样本对中两个样本的评分大小关系当作标签,如果样本对(a1,a2),如果用户对a1评分高于a2,那么将样本对标识为正例,否则标识为负例。模型预测时首先比较每两个样本间的偏序关系,再通过这种偏序关系复原全部样本的整
电子科技大学硕士学位论文12第二章推荐系统中的算法模型与相关概念推荐系统的本质是从海量内容中选取用户感兴趣的部分推荐给用户,工业界推荐系统框架一般分为召回(Recall)和推荐(Recommend)两部分,如图2-1所示。其中,召回是根据用户画像,商品自身特性等简单特征,通过规则匹配等方法为特定用户生成候选商品集合。推荐阶段会引入更加精细的特征,包括用户历史行为,用户和商品交互行为,用户上下文环境等特征,来决定为用户推荐哪些商品。由于这些特征较复杂,数据量也较大,难以人工衡量各个特征的重要性,在不同考虑维度中,各种特征的影响也不一样,故一般使用各种推荐算法和模型来学习特征的重要性,提升推荐的效果。针对具体的应用场景,推荐部分又可以分为点击率预测推荐和排序学习推荐。下面,本章将详细介绍这两个场景的定义及相关模型算法。图2-1推荐系统框架2.1点击率预测模型点击率预测推荐是根据用户和商品的特征预测用户对商品的点击概率,将用
【参考文献】:
期刊论文
[1]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[2]跨媒体分析与推理:研究进展与发展方向(英文)[J]. Yu-xin PENG,Wen-wu ZHU,Yao ZHAO,Chang-sheng XU,Qing-ming HUANG,Han-qing LU,Qing-hua ZHENG,Tie-jun HUANG,Wen GAO. Frontiers of Information Technology & Electronic Engineering. 2017(01)
[3]基于用户日志挖掘的搜索引擎广告效果分析[J]. 陈磊,刘奕群,茹立云,马少平. 中文信息学报. 2008(06)
本文编号:3420895
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3420895.html
最近更新
教材专著