基于排名多臂赌博机的推荐算法研究
发布时间:2021-09-09 16:18
随着互联网技术的高速发展,网络上的信息资源纷繁复杂并呈现爆炸式增长的趋势。推荐系统(Recommendation System,RS)由于具有信息过滤的特点,得到了各领域学者的不断研究。传统的推荐算法对用户偏好的挖掘主要通过分析用户的历史性,在项目候选池与用户池相对静止的场景下能够取得优秀的效果。目前,大量的推荐行为都是通过实时在线的方式完成的,这就要求推荐系统能够及时对用户反馈进行响应,并在一段时间做出连续推荐。传统推荐算法对这种在线环境的动态性难以适应,从而导致了“探索-利用”问题。多臂赌博机(Muit-Arm Bandit,MAB)能够动态处理数据,使用连续的反馈信息不断更新策略,很好地处理“探索-利用”的平衡问题。因此,本文将推荐问题建模为MAB问题,赌博机中的臂对应于要推荐的项目,奖励对应于用户是否点击了推荐的项目。虽然MAB具有优秀的理论支持和应用效果,但现存基于MAB的推荐算法仍具有一定的局限性。其一,每次推荐时仅推荐一个项目,这不符合日常生活中的推荐形式。第二,推荐的项目仅考虑其准确性,忽略了其他评测指标。本文为解决现存基于MAB推荐算法的这两个局限性,提出了基于排名多...
【文章来源】:南宁师范大学广西壮族自治区
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
“在线学习”过程示意图
?传统的推荐算法主要可以分为基于内容的推荐(CB)协同过滤推荐算(CF),混合推荐??三大类K4K25K26:M。具体分类如图2-2所示。其中协同过滤是最受欢迎的推荐算法。由于传??统的算法不是本文主要研究内容,仅作为知识储备,因此在本小节仅作简要介绍。???■??推荐算法?? ̄1 ̄r—?—=7'?'r—1 ̄??基于内容的?|??协同过滤混合推荐??推荐??????I?????1?1???基于近邻的协同过滤?基于算法的协同过滤??I???1?????I?1??I?I?I?I??基于用户的协同[基于项目的协同过1?|?■土?[贝叶斯网络1?[??隐IS?乂具达?固具;云?胃^????图2-2推荐算法分类简图??CB是最早被使用的推荐算法,其原理也非常简单,通过对样本集的学习,获取项目的??描述(知识)后,根据用户历史喜欢的项目,将项目相似度高的项目推荐给用户。以新闻??推荐为例,系统会为曾经喜欢看科技新闻的用户科技新闻。由于算法不需要获取大量评分??数据,只要对项目提取特征就可进行推荐,因此,既不存在数据稀疏问题,也不存在冷启??动问题。但算法依据历史偏好对用户进行推荐,这就导致了推荐结果与用户历史喜欢的项??目的相似性过高
2.?2.1?多臂赌博机原理??多臂赌博机(Multi-armed?bandit,?MAB)的名字来源于对老虎机的戏称t3QK31],示意??图如图2-3所示。老虎机(每台老虎机仅有一个臂),是需要玩家进行摇臂的一种赌博机??器,玩家摇臂后根据机器展示的数值,玩家可能会得到一笔奖励,但是老虎机的设计都是??.?对庄家更有利,因此玩家能获得奖励的几率很小。多臂赌博机从理论上扩展了这种形式,??认为一个老虎机中有多个臂,且每个臂都按照一个独立的概率进行奖励,作为一个玩家,??并不知道机器每个臂的回报概率,唯一可以找到回报概率的方法是进行游戏。玩家最终的??任务是在规定的次数内,通过玩这些机器,获得最高的奖励或者最小化遗憾。??摇臂??f&W???/???k??图2_3?MAB不竟图??将推荐问题建模为多臂赌博机问题,每个手臂表示要推荐给用户的项目,奖励对应于??用户是否点击了推荐的项目。假设有一个拥有M个独立臂的MAB,在每个时间t,摇下一个??臂j并接收从[0
【参考文献】:
期刊论文
[1]融合协同过滤与上下文信息的Bandits推荐算法[J]. 王宇琛,王宝亮,侯永宏. 计算机科学与探索. 2019(03)
[2]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[3]融合矩阵分解的多臂赌博机推荐算法[J]. 成石,王宝亮,毛陆虹,常鹏. 小型微型计算机系统. 2017(12)
[4]在线学习方法综述:汤普森抽样和其他方法[J]. 何斯迈,金羽佳,王华,葛冬冬. 运筹学学报. 2017(04)
[5]消费者视角下的推荐系统研究[J]. 杨一翁,王毅,孙国辉. 企业经济. 2016(09)
[6]网络推荐系统对消费者的营销效果——技术接受模型视角[J]. 杨一翁,王毅,孙国辉. 中国流通经济. 2016(02)
[7]一种结合推荐对象间关联关系的社会化推荐算法[J]. 郭磊,马军,陈竹敏,姜浩然. 计算机学报. 2014(01)
[8]融合邻域模型与隐语义模型的推荐算法[J]. 鲁权,王如龙,张锦,丁怡. 计算机工程与应用. 2013(19)
[9]推荐系统评价指标综述[J]. 朱郁筱,吕琳媛. 电子科技大学学报. 2012(02)
[10]参与的乐趣——一个有中介的调节模型[J]. 楼尊. 管理科学. 2010(02)
博士论文
[1]基于协同过滤的推荐算法研究[D]. 刘青文.中国科学技术大学 2013
本文编号:3392402
【文章来源】:南宁师范大学广西壮族自治区
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
“在线学习”过程示意图
?传统的推荐算法主要可以分为基于内容的推荐(CB)协同过滤推荐算(CF),混合推荐??三大类K4K25K26:M。具体分类如图2-2所示。其中协同过滤是最受欢迎的推荐算法。由于传??统的算法不是本文主要研究内容,仅作为知识储备,因此在本小节仅作简要介绍。???■??推荐算法?? ̄1 ̄r—?—=7'?'r—1 ̄??基于内容的?|??协同过滤混合推荐??推荐??????I?????1?1???基于近邻的协同过滤?基于算法的协同过滤??I???1?????I?1??I?I?I?I??基于用户的协同[基于项目的协同过1?|?■土?[贝叶斯网络1?[??隐IS?乂具达?固具;云?胃^????图2-2推荐算法分类简图??CB是最早被使用的推荐算法,其原理也非常简单,通过对样本集的学习,获取项目的??描述(知识)后,根据用户历史喜欢的项目,将项目相似度高的项目推荐给用户。以新闻??推荐为例,系统会为曾经喜欢看科技新闻的用户科技新闻。由于算法不需要获取大量评分??数据,只要对项目提取特征就可进行推荐,因此,既不存在数据稀疏问题,也不存在冷启??动问题。但算法依据历史偏好对用户进行推荐,这就导致了推荐结果与用户历史喜欢的项??目的相似性过高
2.?2.1?多臂赌博机原理??多臂赌博机(Multi-armed?bandit,?MAB)的名字来源于对老虎机的戏称t3QK31],示意??图如图2-3所示。老虎机(每台老虎机仅有一个臂),是需要玩家进行摇臂的一种赌博机??器,玩家摇臂后根据机器展示的数值,玩家可能会得到一笔奖励,但是老虎机的设计都是??.?对庄家更有利,因此玩家能获得奖励的几率很小。多臂赌博机从理论上扩展了这种形式,??认为一个老虎机中有多个臂,且每个臂都按照一个独立的概率进行奖励,作为一个玩家,??并不知道机器每个臂的回报概率,唯一可以找到回报概率的方法是进行游戏。玩家最终的??任务是在规定的次数内,通过玩这些机器,获得最高的奖励或者最小化遗憾。??摇臂??f&W???/???k??图2_3?MAB不竟图??将推荐问题建模为多臂赌博机问题,每个手臂表示要推荐给用户的项目,奖励对应于??用户是否点击了推荐的项目。假设有一个拥有M个独立臂的MAB,在每个时间t,摇下一个??臂j并接收从[0
【参考文献】:
期刊论文
[1]融合协同过滤与上下文信息的Bandits推荐算法[J]. 王宇琛,王宝亮,侯永宏. 计算机科学与探索. 2019(03)
[2]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[3]融合矩阵分解的多臂赌博机推荐算法[J]. 成石,王宝亮,毛陆虹,常鹏. 小型微型计算机系统. 2017(12)
[4]在线学习方法综述:汤普森抽样和其他方法[J]. 何斯迈,金羽佳,王华,葛冬冬. 运筹学学报. 2017(04)
[5]消费者视角下的推荐系统研究[J]. 杨一翁,王毅,孙国辉. 企业经济. 2016(09)
[6]网络推荐系统对消费者的营销效果——技术接受模型视角[J]. 杨一翁,王毅,孙国辉. 中国流通经济. 2016(02)
[7]一种结合推荐对象间关联关系的社会化推荐算法[J]. 郭磊,马军,陈竹敏,姜浩然. 计算机学报. 2014(01)
[8]融合邻域模型与隐语义模型的推荐算法[J]. 鲁权,王如龙,张锦,丁怡. 计算机工程与应用. 2013(19)
[9]推荐系统评价指标综述[J]. 朱郁筱,吕琳媛. 电子科技大学学报. 2012(02)
[10]参与的乐趣——一个有中介的调节模型[J]. 楼尊. 管理科学. 2010(02)
博士论文
[1]基于协同过滤的推荐算法研究[D]. 刘青文.中国科学技术大学 2013
本文编号:3392402
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3392402.html
最近更新
教材专著