基于排名多臂赌博机的推荐算法研究

发布时间：2021-09-09 16:18

　　随着互联网技术的高速发展,网络上的信息资源纷繁复杂并呈现爆炸式增长的趋势。推荐系统（Recommendation System,RS）由于具有信息过滤的特点,得到了各领域学者的不断研究。传统的推荐算法对用户偏好的挖掘主要通过分析用户的历史性,在项目候选池与用户池相对静止的场景下能够取得优秀的效果。目前,大量的推荐行为都是通过实时在线的方式完成的,这就要求推荐系统能够及时对用户反馈进行响应,并在一段时间做出连续推荐。传统推荐算法对这种在线环境的动态性难以适应,从而导致了“探索-利用”问题。多臂赌博机（Muit-Arm Bandit,MAB）能够动态处理数据,使用连续的反馈信息不断更新策略,很好地处理“探索-利用”的平衡问题。因此,本文将推荐问题建模为MAB问题,赌博机中的臂对应于要推荐的项目,奖励对应于用户是否点击了推荐的项目。虽然MAB具有优秀的理论支持和应用效果,但现存基于MAB的推荐算法仍具有一定的局限性。其一,每次推荐时仅推荐一个项目,这不符合日常生活中的推荐形式。第二,推荐的项目仅考虑其准确性,忽略了其他评测指标。本文为解决现存基于MAB推荐算法的这两个局限性,提出了基于排名多...

【文章来源】：南宁师范大学广西壮族自治区

【文章页数】：59 页

【学位级别】：硕士

【部分图文】：

基于排名多臂赌博机的推荐算法研究

“在线学习”过程示意图

推荐算法,样本集,协同过滤,最早

?传统的推荐算法主要可以分为基于内容的推荐（ＣＢ）协同过滤推荐算（ＣＦ），混合推荐??三大类Ｋ４Ｋ２５Ｋ２６：Ｍ。具体分类如图２－２所示。其中协同过滤是最受欢迎的推荐算法。由于传??统的算法不是本文主要研究内容，仅作为知识储备，因此在本小节仅作简要介绍。???■??推荐算法??￣１￣ｒ—？—＝７＇?＇ｒ—１￣??基于内容的?｜??协同过滤混合推荐??推荐??？???Ｉ?????１?１???基于近邻的协同过滤?基于算法的协同过滤??Ｉ???１?????Ｉ?１??Ｉ?Ｉ?Ｉ?Ｉ??基于用户的协同［基于项目的协同过１?｜?■土?［贝叶斯网络１?［??隐ＩＳ?乂具达?固具；云?胃＾????图２－２推荐算法分类简图??ＣＢ是最早被使用的推荐算法，其原理也非常简单，通过对样本集的学习，获取项目的??描述（知识）后，根据用户历史喜欢的项目，将项目相似度高的项目推荐给用户。以新闻??推荐为例，系统会为曾经喜欢看科技新闻的用户科技新闻。由于算法不需要获取大量评分??数据，只要对项目提取特征就可进行推荐，因此，既不存在数据稀疏问题，也不存在冷启??动问题。但算法依据历史偏好对用户进行推荐，这就导致了推荐结果与用户历史喜欢的项??目的相似性过高

多臂,手臂,问题,建模

２．?２．１?多臂赌博机原理??多臂赌博机（Ｍｕｌｔｉ－ａｒｍｅｄ?ｂａｎｄｉｔ，?ＭＡＢ）的名字来源于对老虎机的戏称ｔ３ＱＫ３１］，示意??图如图２－３所示。老虎机（每台老虎机仅有一个臂），是需要玩家进行摇臂的一种赌博机??器，玩家摇臂后根据机器展示的数值，玩家可能会得到一笔奖励，但是老虎机的设计都是??．?对庄家更有利，因此玩家能获得奖励的几率很小。多臂赌博机从理论上扩展了这种形式，??认为一个老虎机中有多个臂，且每个臂都按照一个独立的概率进行奖励，作为一个玩家，??并不知道机器每个臂的回报概率，唯一可以找到回报概率的方法是进行游戏。玩家最终的??任务是在规定的次数内，通过玩这些机器，获得最高的奖励或者最小化遗憾。??摇臂??ｆ＆Ｗ???／???ｋ??图２＿３?ＭＡＢ不竟图??将推荐问题建模为多臂赌博机问题，每个手臂表示要推荐给用户的项目，奖励对应于??用户是否点击了推荐的项目。假设有一个拥有Ｍ个独立臂的ＭＡＢ，在每个时间ｔ，摇下一个??臂ｊ并接收从［０

【参考文献】：
期刊论文
[1]融合协同过滤与上下文信息的Bandits推荐算法[J]. 王宇琛,王宝亮,侯永宏.  计算机科学与探索. 2019(03)
[2]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅.  计算机学报. 2018(07)
[3]融合矩阵分解的多臂赌博机推荐算法[J]. 成石,王宝亮,毛陆虹,常鹏.  小型微型计算机系统. 2017(12)
[4]在线学习方法综述:汤普森抽样和其他方法[J]. 何斯迈,金羽佳,王华,葛冬冬.  运筹学学报. 2017(04)
[5]消费者视角下的推荐系统研究[J]. 杨一翁,王毅,孙国辉.  企业经济. 2016(09)
[6]网络推荐系统对消费者的营销效果——技术接受模型视角[J]. 杨一翁,王毅,孙国辉.  中国流通经济. 2016(02)
[7]一种结合推荐对象间关联关系的社会化推荐算法[J]. 郭磊,马军,陈竹敏,姜浩然.  计算机学报. 2014(01)
[8]融合邻域模型与隐语义模型的推荐算法[J]. 鲁权,王如龙,张锦,丁怡.  计算机工程与应用. 2013(19)
[9]推荐系统评价指标综述[J]. 朱郁筱,吕琳媛.  电子科技大学学报. 2012(02)
[10]参与的乐趣——一个有中介的调节模型[J]. 楼尊.  管理科学. 2010(02)

博士论文
[1]基于协同过滤的推荐算法研究[D]. 刘青文.中国科学技术大学 2013

本文编号：3392402

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3392402.html

上一篇：基于图像块匹配的异源图像配准
下一篇：基于教育信息化的农村初中教学管理问题研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|