当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于遗忘曲线的推荐算法研究

发布时间:2017-10-07 23:07

  本文关键词:基于遗忘曲线的推荐算法研究


  更多相关文章: 推荐系统 协同过滤 遗忘曲线 冷启动 社区划分


【摘要】:随着信息技术和互联网技术的发展,人们进入“信息爆炸”的时代,面对海量信息,用户不知道如何将自己感兴趣信息从这海量的信息中提取出来,搜索引擎已经不能满足人们的需要,推荐系统成为解决这一需要的重要方式。而协同过滤因为其算法简单,又能够处理复杂的问题并产生比较良好的效果而被人们广泛应用,也成为了推荐系统中最成功的技术。然而用户的兴趣是时刻变化的,且对于新用户系统无法预测用户的偏好,原始的推荐技术并没有满足这些需求,而本文就是致力于这方面问题的解决。 首先,本文提出了基于艾宾浩斯遗忘曲线的用户推荐算法,由于人的兴趣是不断变化的,而这种变化是自然遗忘的过程,也就符合遗忘曲线,所以用遗忘函数模拟人的兴趣变化。由于时间对评分的起着很重要的作用,在使用相似度算法时加入了时间因子,对用户的原始评分进行衰减,以此来反应用户的兴趣变化。然后为本文提出的算法设计了两组实验来验证算法的有效性。通过两组实验的结果证明,总体上来讲,本文提出的基于遗忘曲线的相似度的计算方法比传统的算法要好一些。那么在推荐系统中,结合自然规律,通过运用艾氏遗忘曲线所表述的遗忘的规律来反应用户兴趣的变化,对用户评分进行衰减,可以明显的提高系统预测的准确度。这也表明,在推荐系统中,人的认知规律可以发挥很重要的作用。 其次,基于以上的内容,本文针对推荐系统中冷启动问题又做了详细的研究,分析和比较了前辈们提出的各种解决冷启动问题的算法,明确每个算法的优点和不足;同时介绍了通过交叉推荐引起的思考,由于人生活在社会中,不同的人有不同的社交圈,而目标用户社交圈中的人的偏好在某种程度上可以反映目标用户的偏好,基于这种思想,结合Sahebi提出的算法,将遗忘曲线的思想加入进去,提出了在多维网络中基于用户社区划分来解决冷启动的方案。通过清空数据集中用户的书评来模拟系统中的冷启动问题,在能克服冷启动问题的情况下,用社区群体的兴趣漂移来预测用户对图书的评分。对于本文在实验部分将此方案与传统的协同过滤推荐算法进行了对比。实验证明,在邻居数不断增加的条件下,前者预测的准确度要优于后者,也就是说,该算法能够克服冷启动问题提高推荐质量。
【关键词】:推荐系统 协同过滤 遗忘曲线 冷启动 社区划分
【学位授予单位】:安徽理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:
  • 摘要5-6
  • Abstract6-14
  • 1 绪论14-20
  • 1.1 课题研究背景14
  • 1.2 国内外研究现状14-19
  • 1.3 本文研究的主要内容19-20
  • 2 推荐系统相关理论研究20-30
  • 2.1 推荐系统20
  • 2.2 协同过滤推荐算法20-22
  • 2.2.1 基于用户的协同过滤21
  • 2.2.2 基于项目的协同过滤21-22
  • 2.3 基于内容的推荐系统22-25
  • 2.4 混合推荐25-27
  • 2.4.1 加权混合(Weighted hybrid)25
  • 2.4.2 转换混合(Switching hybrid)25
  • 2.4.3 合并混合(Mixed hybrid)25-26
  • 2.4.4 特征组合混合(Feature combination hybrid)26
  • 2.4.5 级联混合(Cascade hybrid)26
  • 2.4.6 特征增强混合(Feature augmentation hybrid)26-27
  • 2.4.7 元层次混合(Meta-level hybrid)27
  • 2.5 推荐技术中常用的算法27-30
  • 2.5.1 余弦相似性(Cosine)27
  • 2.5.2 修正的余弦相似性(AdjustedCosine)27-28
  • 2.5.3 皮尔森相似性(Pearson similarity)28
  • 2.5.4 评分预测28-29
  • 2.5.5 Top-N推荐29-30
  • 3 基于自然遗忘的协同过滤算法30-34
  • 3.1 艾宾浩斯遗忘曲线30
  • 3.2 艾宾浩斯遗忘曲线描述30-31
  • 3.3 遗忘函数31-32
  • 3.4 具有记忆效应的相似度计算32-33
  • 3.5 算法流程33-34
  • 4 实验设计及结果分析34-41
  • 4.1 推荐系统性能评测标准34-35
  • 4.2 实验数据准备与设计35-37
  • 4.2.1 数据准备35-36
  • 4.2.2 实验设计36-37
  • 4.3 实验结果分析37-41
  • 4.3.1 实验一37-39
  • 4.3.2 实验二39-41
  • 5 推荐系统中冷启动的解决方案研究41-47
  • 5.1 不考虑内容的解决方法41-43
  • 5.1.1 随机推荐或热门推荐41-42
  • 5.1.2 缺省值填充42
  • 5.1.3 改进的相似度度量法42-43
  • 5.2 结合内容信息的解决方法43-44
  • 5.2.1 基于评分矩阵扩充的方法43
  • 5.2.2 构建概率统计模型的方法43
  • 5.2.3 与机器学习相结合的方法43-44
  • 5.3 用户社区划分解决冷启动问题44-47
  • 5.3.1 算法流程44-45
  • 5.3.2 算法验证45-46
  • 5.3.3 实验结论46-47
  • 6 结论47-49
  • 致谢49-50
  • 参考文献50-53
  • 作者简介及读研期间主要科研成果53

【参考文献】

中国期刊全文数据库 前10条

1 时京晶;;三种经典复杂网络社区结构划分算法研究[J];电脑与信息技术;2011年04期

2 吴婷;熊前兴;贺曦春;;基于用户特征和用户兴趣变化的协同过滤推荐[J];电脑知识与技术;2008年34期

3 万里;廖建新;朱晓民;;一种动态网络社区划分算法[J];北京工业大学学报;2011年02期

4 印桂生;崔晓晖;马志强;;遗忘曲线的协同过滤推荐模型[J];哈尔滨工程大学学报;2012年01期

5 邢春晓;高凤荣;战思南;周立柱;;适应用户兴趣变化的协同过滤推荐算法[J];计算机研究与发展;2007年02期

6 郑先荣;汤泽滢;曹先彬;;适应用户兴趣变化的非线性逐步遗忘协同过滤算法[J];计算机辅助工程;2007年02期

7 李克潮;梁正友;;适应用户兴趣变化的指数遗忘协同过滤算法[J];计算机工程与应用;2011年13期

8 郑先荣;曹先彬;;线性逐步遗忘协同过滤算法的研究[J];计算机工程;2007年06期

9 于洪;李转运;;基于遗忘曲线的协同过滤推荐算法[J];南京大学学报(自然科学版);2010年05期

10 张光卫;李德毅;李鹏;康建初;陈桂生;;基于云模型的协同过滤推荐算法[J];软件学报;2007年10期



本文编号:990575

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/990575.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c8fdd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com