融合帕累托占优的增强协同过滤方法研究
发布时间:2017-11-10 06:14
本文关键词:融合帕累托占优的增强协同过滤方法研究
【摘要】:互联网的蓬勃发展使得人们生活在信息量浩瀚如海的数据爆炸时代,人们每天都面临着众多选择,但用户往往会在花费了大量的时间和金钱后还不能找到满足心意的信息。推荐技术的出现就是让用户在选择困难时帮助用户发现他们可能会感兴趣的信息,了解他们的潜在需求。推荐服务可以引导用户在网上商城选购商品,可以在社交网络中推荐朋友,可以推荐影片、美食、书籍等等,给人们的生活带来极大的便利。在不同类型的推荐算法中,协同过滤推荐算法建立的模型比较简单,使用用户的评分数据分析用户的偏好,不依赖用户或物品的属性等数据,数据采集方便,推荐质量比较好,因此成为学术界和工业界都广泛研究的推荐算法。在调研了现有的不同类型的协同过滤推荐算法后,结合现有的实验条件,本文选择研究基于用户的(user-based)协同过滤方法。本文分析了协同过滤推荐算法面临的一些问题,研究了一些对存在的问题的解决方法,从中获得启发,本文提出了一种新的方法来缓解协同过滤算法存在的数据稀疏性问题。方法是在计算相似度之前采用帕累托占优(Pareto Dominance)理论预过滤掉那些低相似度的用户,再将共同评分所占比例的影响因素引入PIP相似度计算方法来改进相似度测量,PIP方法是由邻近度(Proximity),影响力(Impact),流行度(Popularity)三个影响因素构成。在经典的两个不同大小的数据集MovieLens上进行实验,对比现有的常用相似度计算方法改进后的算法,和JPIP和PIP算法。采用MAE(Mean Absolute Error,平均绝对误差)值、准确率和召回率作为评测指标。实验结果表明本文提出的融合帕累托占优的预过滤处理结合JPIP的相似度计算的方法较其他方法在推荐质量上有所提高。本文的贡献有:(1)利用帕累托占优理论预先过滤低相似度的用户,提高了找到高相似度近邻用户的可能。(2)相比传统的相似度测量只利用了评分数据呈现出的浅层内容,本文的方法通过深入分析数据表达出的深层含义来改进相似度衡量标准。(3)本文的方法相比列举出的其他方法在推荐质量上有所提高,同时也缓解了数据稀疏性问题。
【学位授予单位】:西华大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【参考文献】
中国期刊全文数据库 前6条
1 邢哲;梁竞帆;朱青;;多维度自适应的协同过滤推荐算法[J];小型微型计算机系统;2011年11期
2 郭艳红;邓贵仕;雒春雨;;基于信任因子的协同过滤推荐算法[J];计算机工程;2008年20期
3 张光卫;李德毅;李鹏;康建初;陈桂生;;基于云模型的协同过滤推荐算法[J];软件学报;2007年10期
4 邢春晓;高凤荣;战思南;周立柱;;适应用户兴趣变化的协同过滤推荐算法[J];计算机研究与发展;2007年02期
5 贾丽会;张修如;;BP算法分析与改进[J];计算机技术与发展;2006年10期
6 阮彤,冯东雷,李京;基于贝叶斯网络的信息过滤模型研究[J];计算机研究与发展;2002年12期
中国硕士学位论文全文数据库 前1条
1 王云凯;基于降维技术和分布式计算的协同过滤可扩展性问题解决方案[D];西南财经大学;2014年
,本文编号:1165411
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1165411.html