当前位置:主页 > 科技论文 > 搜索引擎论文 >

面向稀疏数据的个性化推荐技术研究

发布时间:2017-09-27 10:12

  本文关键词:面向稀疏数据的个性化推荐技术研究


  更多相关文章: 数据稀疏 个性化推荐 信任相似度 稀疏子空间 协同过滤


【摘要】:随着互联网和电子商务的发展,互联网信息与日俱增,产生了“信息过载”现象,用户很难找到自己需要的信息。搜索引擎的问世节省了搜索时间,可以快速定位用户需要的信息,但是缺少定制个性化检索结果的能力。个性化推荐技术根据用户历史行为信息,提供个性化推荐服务,满足用户需求,可以有效解决信息过载问题。但是随着个性化推荐系统规模越来越大,用户历史行为信息相对越来越少,评分矩阵极度稀疏,导致推荐质量下降。为了缓解数据稀疏带来的影响,目前的主要方法是维数约简,采用特征提取或者利用机器学习方法降低维度,还可以使用数据压缩原理减少系统数据的维度。现有的推荐技术在降低维度的过程中都会舍弃掉部分重要信息,使得相似度计算和近邻查找的精度不高,从而影响推荐效果。针对现有推荐技术在数据稀疏情况下存在的问题进行研究,主要工作如下:1.当评分矩阵极度稀疏时,使用现有的相似度量方法计算用户相似度的准确率不高,导致依据用户相似矩阵查找最近邻居以及计算评分预测值的精确度下降。对此,提出基于聚类和信任度的个性化推荐算法,定义信任相似度,将基于评分众数的用户信任度融合到基于用户评分的传统相似度量算法中。在MovieLens数据集上进行测试,实验结果证明,提出的基于聚类和信任度的个性化推荐算法计算出的用户相似度的精度更高,有助于寻找到适合的最近邻居用户,更加准确地填充评分预测值,避免用户恶意评分的情况,在数据稀疏的情况下提高用户相似度计算的准确率,提高推荐精度。2.目前推荐系统的评分数据具有高维性和稀疏性,例如多媒体数据、购物数据等,现有针对高维稀疏数据的推荐算法大都基于维度约简,在降低维度的过程中舍弃了过多有用信息,导致查找近邻的精度下降。为此,提出基于稀疏子空间聚类的个性化推荐算法,利用稀疏子空间聚类算法对用户进行聚类,减少有用信息的舍弃,找到所属聚类簇,计算相似度,利用KNN(K-Nearest Neighbor)方法查找最近邻集合,根据近邻集合的评分值计算预测评分值。在MovieLens数据集上进行测试,实验结果证明,基于稀疏子空间聚类的个性化推荐算法可以积极缓解在数据稀疏情况下查找近邻不精准的问题,提高推荐质量。
【关键词】:数据稀疏 个性化推荐 信任相似度 稀疏子空间 协同过滤
【学位授予单位】:西南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
  • 摘要5-6
  • Abstract6-8
  • 第1章 绪论8-15
  • 1.1 研究背景及意义8-9
  • 1.2 研究现状9-13
  • 1.3 主要工作13-14
  • 1.4 论文结构14-15
  • 第2章 相关理论和技术15-30
  • 2.1 个性化推荐技术概述15-18
  • 2.2 协同过滤算法18-27
  • 2.2.1 协同过滤算法概述18
  • 2.2.2 协同过滤算法分类18
  • 2.2.3 基于内存的协同过滤算法18-26
  • 2.2.4 基于模型的协同过滤算法26-27
  • 2.4 数据集与评价标准27-29
  • 2.4.1 数据集27
  • 2.4.2 评价标准27-29
  • 2.5 本章小结29-30
  • 第3章 基于聚类和信任度的个性化推荐算法30-41
  • 3.1 算法框架30-32
  • 3.2 用户聚类32
  • 3.3 用户信任度量32-33
  • 3.4 查找最近邻33-34
  • 3.5 生成推荐结果34-35
  • 3.6 算法流程35
  • 3.7 实验35-40
  • 3.7.1 实验环境35
  • 3.7.2 实验数据35-36
  • 3.7.3 评价标准36-37
  • 3.7.4 实验结果37-40
  • 3.8 本章小结40-41
  • 第4章 基于稀疏子空间聚类的个性化推荐算法41-52
  • 4.1 算法框架41-43
  • 4.2 用户聚类43-44
  • 4.3 计算用户相似性44
  • 4.4 查找最近邻44-45
  • 4.5 生成推荐结果45
  • 4.6 算法流程45
  • 4.7 实验45-51
  • 4.7.1 实验数据45-46
  • 4.7.2 实验结果46-51
  • 4.8 本章小结51-52
  • 第5章 总结与展望52-54
  • 5.1 工作总结52-53
  • 5.2 展望53-54
  • 参考文献54-58
  • 致谢58-59
  • 攻读硕士学位期间公开发表的论文59

【相似文献】

中国期刊全文数据库 前10条

1 高山武;李争武;;智能匹配中的实例相似度的研究[J];电脑知识与技术(学术交流);2007年10期

2 操牡丹;何前锋;王柏;;中医药方剂相似度模型[J];计算机工程;2009年16期

3 范海雄;刘付显;夏璐;;融合裕度和否决权的案例相似度量方法[J];计算机工程;2012年12期

4 付海艳;张诚一;;基于正规三角模糊集相似度量的模糊推理[J];计算机工程与应用;2006年15期

5 黄艺美;曹爱增;李金屏;;Vague集元素等相似度图形化表示[J];济南大学学报(自然科学版);2007年04期

6 江伟;梁家荣;;一种新的基于包含度的Vague相似度[J];软件导刊;2012年03期

7 石玉强,王鸿绪;计算Vague集之间的相似度的一种新方法[J];计算机工程与应用;2005年27期

8 郑浩森;汤胤;彭宏;郑启伦;;范例的代数结构及其相似度量的研究[J];计算机工程与应用;2006年04期

9 陈传波;吕泽华;秦培煜;夏晖;;基于正态分布函数的直觉模糊集的相似度量方法[J];小型微型计算机系统;2007年03期

10 徐凤生;;Vague集之间相似性的度量方法[J];计算机工程与应用;2012年19期

中国重要会议论文全文数据库 前1条

1 陈宁;陈安;周龙骧;;混合类型数据相似度及网格聚类算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

中国博士学位论文全文数据库 前1条

1 吕泽华;模糊集理论的新拓展及其应用研究[D];华中科技大学;2007年

中国硕士学位论文全文数据库 前10条

1 石教开;面向稀疏数据的个性化推荐技术研究[D];西南大学;2016年

2 张敏;边界不确定性集合的相似度量的研究[D];西安电子科技大学;2006年

3 贺笑;基于形状特性的人脸相似度的描述与分析[D];南京理工大学;2014年

4 林娟;粗糙集的相似度量和属性约简[D];河北师范大学;2015年

5 高鹏;推荐系统中信息相似度的研究及其应用[D];上海交通大学;2013年

6 孙瑞;模糊数的相似度及其在风险分析中的应用[D];西华大学;2013年

7 王娅茜;基于节点相似度的网络社团挖掘研究[D];电子科技大学;2015年

8 章四兵;基于相似度量的机械产品系统的分类方法研究[D];合肥工业大学;2004年

9 唐志刚;Vague集理论及其应用研究[D];广西大学;2007年

10 李哲;相似度量及其在系统发育分析中的应用研究[D];湘潭大学;2013年



本文编号:929087

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/929087.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b3969***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com