当前位置:主页 > 科技论文 > 软件论文 >

基于聚类矩阵近似的协同过滤推荐模型研究

发布时间:2021-10-01 01:52
  基于矩阵分解技术的系统过滤是一种常见的推荐技术,但是由于用户和商品数据的稀疏性和推荐系统可扩展性差的问题,使推荐系统的准确性和计算效率受到了巨大挑战。本文提出基于显性信息和隐性信息聚类矩阵近似的协同过滤推荐模型,该模型主要针对推荐系统中存在的用户商品数据的稀疏问题和推荐系统可扩展性较差问题进行改进,以期提升推荐系统的准确率与计算效率。基于显性信息的聚类矩阵近似的协同过滤推荐方法通过用户和商品同时聚类来考虑用户对于商品兴趣的局部特性,找到评分矩阵的内在结构,形成稠密矩阵块。同时,该方法应用的是真实评分数据,而不是填充数据,从而较少地将缺失数据纳入计算范围,减少了噪声数据的干扰,提升了推荐质量。在稠密矩阵块内部做推荐减少了推荐系统整体的数据输入,提高了计算效率。基于隐性信息的聚类矩阵近似的协同过滤推荐方法首先将用户-商品评分矩阵转化为进过处理后的偏好指示矩阵,在此基础上进行寻找最相似的用户-商品稠密矩阵块。然后将通过偏好指示矩阵找到的稠密矩阵块中的数据还原为原始用户对商品的评分数据,并进行矩阵近似和对用户进行推荐。最后,本文选取MovieLens-100K电影评分真实数据集进行试验,并采用... 

【文章来源】:北京化工大学北京市 211工程院校 教育部直属院校

【文章页数】:73 页

【学位级别】:硕士

【部分图文】:

基于聚类矩阵近似的协同过滤推荐模型研究


图2-1?SVD分解示意图??Fig.2-1?SVD?decomposition?diagram??

示意图,原理,示意图,主题


?北京化工大学硕士学位论文???n??^?m??图2-2:?PLSA原理示意图??Fig.2-2?PLSA?decomposition?diagram??在PLSA中,首先定义潜在主题变量Z?=?,…,\卜表示选择用户%??的概率,表示在用户给定w,的情况下,该用户拥有兴趣主题\的概率,??表示在兴趣主题&给定的情况下选择商品乂的概率。那么,公式(2-4)??计算了商品&被用户%选中的概率。??P(*)?=?ZP“|々(小)?(2-4)??该模型一般在训练数据上采用EM算法进行求解,详细的求解步骤可以参见??文献(81)。在给定兴趣主题数量h并计算出用户的兴趣主题概率^以及??兴趣主题々下商品概率之后,根据公式(2-4)即可为用户推荐商品。??之后,用户对商品评分的估算可由公式(2-5)得到。此处,rate表示评分矩??max??阵尺中的最高评分。??P(9j\ui)?=?TP(9j\zk)P^M)xrate^??(2-5)??k??2_2_?2.3基于SGD?(Stochastic?Gradient?Descent,随机梯度下降)的协同过滤??方法??SGD原理??定义一组m个自变量为,…,'卜因变量为少2,__?,凡J,目标??14??

分布图,零数,数据集,分布图


?第五章实验与分析???第五章实验与分析??5.?1实验数据??本文采用经典的MovieLens-100K数据集4。该数据集有100,000个评分数据,??来自943个用户,每个用户至少评分过20个以上的电影,共1682部电影。评分??数据分为五个等级,分别是1、2、3、4、5,评分按照由高到低的顺序,越低标??示用户对该电影的评价越低,越高标示用户对该电影的评价越高。经过整理后,??本文将MovieLens-100K数据集转化为一个943行、1682列的用户-商品评分矩??阵R。其中,每一行数据代表一个用户对所有商品的评分,每一列数据代表一个??商品被所有的用户的评分,矩阵中的数值表示位于该行的用户对位于该列的商品??的评分。计算该矩阵中评分不为0的数据占全部数据的比重可以得到矩阵的稠密??度为6.3%,也就是说,该矩阵的稀疏性为93.7%,这意味着该矩阵中93.7%的数??据都是0。图6显示了该数据集非零数据的分布状态(图中NZ是none?zero的缩??写):??三??0?2£K)?400?600?K)0?1000?1200?1400?1600??nz?=?100000??图5-1?MovieLens-100K数据集非零数据分布图??Fig.5-1?MovieLens-100K?Data?Set?Non-zero?Data?Distribution?Map??4《Movielens?数据集》,online:??https://grouplens.org/datasets/movielens/??31??

【参考文献】:
期刊论文
[1]基于稀疏聚类和信任度的协同过滤算法[J]. 侯宇博.  信息与电脑(理论版). 2018(07)
[2]基于双层相似度的协同过滤推荐算法[J]. 谢毅刚,郭卫斌,李建华.  华东理工大学学报(自然科学版). 2018(01)
[3]矩阵分解在大规模个性化推荐系统中的实际应用[J]. 徐细林,李毅.  现代计算机(专业版). 2018(05)
[4]运行在Hadoop上的基于用户的协同过滤推荐算法研究[J]. 王斯锋,祝永志,刘文超.  电子技术. 2017(11)
[5]基于矩阵分解的个性化推荐系统研究[J]. 张时俊,王永恒.  中文信息学报. 2017(03)
[6]国内电子商务网站推荐系统信息服务质量比较研究——以淘宝、京东、亚马逊为例[J]. 洪亮,任秋圜,梁树贤.  图书情报工作. 2016(23)
[7]基于Web日志挖掘和相关性度量的电子商务推荐系统[J]. 马勇,鲜敏,郑翔,黎远松.  计算机系统应用. 2016(08)
[8]基于地理位置的个性化新闻混合推荐研究[J]. 陶永才,李俊艳,石磊,卫琳.  小型微型计算机系统. 2016(05)
[9]基于用户的协同过滤算法的推荐效率和个性化改进[J]. 王成,朱志刚,张玉侠,苏芳芳.  小型微型计算机系统. 2016(03)
[10]网络推荐系统对消费者的营销效果——技术接受模型视角[J]. 杨一翁,王毅,孙国辉.  中国流通经济. 2016(02)

博士论文
[1]社会网络中基于社会关系的推荐算法研究[D]. 郭磊.山东大学 2015

硕士论文
[1]基于用户需求深度驱动的个性化推荐算法研究[D]. 刘倩倩.山东师范大学 2017
[2]基于协同过滤的推荐算法研究与引擎设计[D]. 王世晖.电子科技大学 2017
[3]基于用户协同过滤推荐技术的研究与实现[D]. 郎鹏程.宁夏大学 2017
[4]基于网厅用户隐私行为的个性化推荐系统的设计和研究[D]. 束宇.南京邮电大学 2016
[5]基于概率矩阵分解的个性化推荐系统研究[D]. 谭凤.西南大学 2015
[6]协同过滤推荐算法稀疏性与可扩展性问题研究[D]. 李小浩.重庆大学 2015
[7]基于矩阵分解和随机游走相结合的推荐算法[D]. 杨永向.北京交通大学 2014
[8]基于分类的推荐系统优化方法研究[D]. 朱洪青.华中科技大学 2014



本文编号:3417018

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3417018.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9d5f6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com