基于社会兴趣聚类的协同过滤推荐算法研究
发布时间:2019-07-16 14:36
【摘要】:互联网的软件的发展和硬件性能的提升,为电子商务发展提供了很好的支撑。与此同时电子商务网站用户面对的信息越来越多,海量的商品信息使得用户获取满足自己需求的商品和信息难度增大,这就使得用户面临着严重的“信息超载”和“选择障碍”问题。搜索引擎的出现在一定程度上能够解决用户面临的信息超载问题,但是通过搜索引擎获取信息这一过程是大众化的,这种大众化信息无法满足用户个性化的需求,用户需要电子商务网站能够根据他们的喜好向其给出其可能感兴趣的商品的推荐。 推荐算法应运而生,其中运用最为广泛的是协同过滤推荐算法。协同过滤推荐算法主要是根据用户对商品的评分信息给出推荐,因此忽略了比较重要的UGC(用户产生内容),如:标签、评论等重要信息,然而已经存在的相关研究很少有同时从标签语义和社区的角度来分析问题。本研究旨在综合利用评分和标签两方面的信息来给用户产生个性化推荐,同时考虑到现实生活中用户的社区性,分析和挖掘用户的社会兴趣,利用评分信息和用户评分类型信息来计算用户的相似度,深入分析标签信息来挖掘用户的社会兴趣,根据用户的社会兴趣将用户进行聚类,再根据基于社会兴趣的聚类结果,结合本文提出的推荐算法提出了基于社会兴趣聚类的协同过滤算法。从理论上,该算法能够一定程度的提高推荐的准确度。 本文使用Movielens电影数据集对本文推荐算法的推荐的质量和传统的推荐算法进行比较,选取MAE(平均绝对偏差)和RMSE(均方根偏差)作为推荐质量的评价标准,对本文提出的算法进行试验,,得出试验结果,并对得出的试验结果进行深入分析,进而得到本文的最终研究成果,同时根据研究成果和模型的存在的问题做出总结。
文内图片:
图片说明: 哈尔滨工业大学管理学硕士学位论文为了更好的比较相似度混合系数的不同对推荐质量的影响,选择在最优的用户邻居数 30 时绘制矩形图 4-2 来进行进一步比较。
文内图片:
图片说明:用户邻居数为30时不同混合系数MAE值结果图
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3
本文编号:2515123
文内图片:
图片说明: 哈尔滨工业大学管理学硕士学位论文为了更好的比较相似度混合系数的不同对推荐质量的影响,选择在最优的用户邻居数 30 时绘制矩形图 4-2 来进行进一步比较。
文内图片:
图片说明:用户邻居数为30时不同混合系数MAE值结果图
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3
【参考文献】
相关期刊论文 前6条
1 赵亮,胡乃静,张守志;个性化推荐算法设计[J];计算机研究与发展;2002年08期
2 张锋;常会友;;使用BP神经网络缓解协同过滤推荐算法的稀疏性问题[J];计算机研究与发展;2006年04期
3 张光卫;李德毅;李鹏;康建初;陈桂生;;基于云模型的协同过滤推荐算法[J];软件学报;2007年10期
4 许海玲;吴潇;李晓东;阎保平;;互联网推荐系统比较研究[J];软件学报;2009年02期
5 余金香;;Folksonomy及其国外研究进展[J];图书情报工作;2007年07期
6 邓爱林,左子叶,朱扬勇;基于项目聚类的协同过滤推荐算法[J];小型微型计算机系统;2004年09期
本文编号:2515123
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2515123.html