面向推荐系统的数据稀疏问题研究
本文关键词: 大数据 推荐系统 数据稀疏 冷启动 出处:《吉林大学》2017年硕士论文 论文类型:学位论文
【摘要】:众所周知,互联网近几年发展速度超乎人们的想象,用户在互联网上留下的信息不计其数。怎样从这些超量的互联网信息中挖取出用户感兴趣的内容,并且主动推荐给用户,这是推荐系统所要解决的问题和主要任务。随着用户的日益增多,各种门户网站、电子商务网站以及各大公司的系统为用户提供了更多更好的信息服务。以电子商务网站为例,面对多种多样的网购信息,对于知道自己想要什么的用户来说,可以利用电子商务网站的搜索引擎查询自己想要购买的产品。但是,往往用户的需求具有不确定性和模糊性,因为有些时候他们也描述不清自己想要的东西。此时,如果购物网站能够准确给用户推荐那些用户描述不清的商品信息,便能培养用户对自己网站的依赖感,为自己的网站带来巨额的利润,从而能够在竞争激烈的商业市场站稳脚跟。怎样在海量的信息中找到用户的需求并推荐给客户,是各大互联网商家面临的严峻挑战,成为许多学者和专家的热门研究课题。在这种商业驱动和学术氛围的背景下,基于大数据的推荐系统应用而生。推荐系统能够很好的解决当今互联网中“信息过载”这一棘手问题,深受各大公司和电子商务网站的欢迎。然而推荐系统并不是万能的,面对互联网中越来越多的不同种类的数据与一些越来越复杂的应用场景,推荐系统也面临着诸多待解决的问题。这些问题是一些未被很好解决的理论和应用层面上的难题。推荐系统领域研究的热点主要集中在系统的可扩展性,新用户与新项目的冷启动问题,数据稀疏问题等等[1]。数据稀疏问题成为推荐系统发展的一个瓶颈,该问题的存在严重影响了推荐系统的推荐质量。如何解决数据稀疏问题成为保障推荐系统推荐质量的关键所在。推荐系统数据稀疏性问题的产生是因为其在推荐的过程中,需要依赖用户对项目的评分数据来挖掘用户的爱好信息,从而向用户进行推荐,该数据的依赖量影响着推荐精度。这些依赖的数据越多,推荐出来的结果就越准确。但是现实往往事与愿违,推荐系统的用户往往会因为一些原因没有留下评分数据,造成推荐系统可依赖的数据量稀少。因此,推荐系统很难依据数据来找到相似用户,最终导致推荐系统的准确度不高,使得目标用户不满意。本文致力于研究推荐系统的数据稀疏性问题,在前人研究的基础之上对数据稀疏性问题进行了相关的研究。本文的主要研究工作如下:1、阐述了推荐系统数据稀疏性问题产生的原因,并分析其给推荐系统推荐精度上带来的影响。2、指出了现有阶段解决数据稀疏性问题方法的不足之处。固定填充法没有考虑用户与项目的特征属性,会对推荐准确性带来偏差;矩阵降维法容易丢失有效数据,使得预测出来的评分不准确;Content-based CF没有数据稀疏问题,但是不能够发现用户潜在感兴趣的新项目,推荐系统失去意义。3、通过分析User-based CF和Item-based CF各自的优势提出了一种结合传统CF填充矩阵来解决推荐系统的数据稀疏性问题的思想。该思想不仅缓解了推荐系统的数据稀疏性问题,而且还能够极大改善推荐系统推荐性能以及提高推荐系统推荐质量。4、以Apache Mahout推荐技术框架以及Movie Lens数据集进行实验验证,并和传统协同过滤推荐算法进行分析对比,证实了新提出的组合传统CF填充矩阵思想能够缓解稀疏性问题,极大改善推荐系统的推荐质量。
[Abstract]:It is well known that the development speed of Internet in recent years is beyond the imagination of people , and the information left by users on the Internet is not counted . How to find the user ' s dependence on the web site by using e - commerce website and recommend it to users is a hot research topic for users . The data sparsity problem is one of the bottlenecks in the development of the recommended system . The problem of data sparsity is the key to the recommendation system ' s recommendation quality .
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3
【参考文献】
相关期刊论文 前10条
1 刘慧婷;陈艳;肖慧慧;;基于用户偏好的矩阵分解推荐算法[J];计算机应用;2015年S2期
2 顾立志;;电子商务推荐系统主要推荐技术研究[J];计算机光盘软件与应用;2014年08期
3 刘传振;;社会网络服务中好友推荐算法研究[J];科技传播;2013年19期
4 曹一鸣;;协同过滤推荐瓶颈问题综述[J];软件;2012年12期
5 黄正;;协同过滤推荐算法综述[J];价值工程;2012年21期
6 王国霞;刘贺平;;个性化推荐系统综述[J];计算机工程与应用;2012年07期
7 孙金刚;艾丽蓉;;基于项目属性和云填充的协同过滤推荐算法[J];计算机应用;2012年03期
8 吴月萍;王娜;马良;;基于蚁群算法的协同过滤推荐系统的研究[J];计算机技术与发展;2011年10期
9 吴一帆;王浩然;;结合用户背景信息的协同过滤推荐算法[J];计算机应用;2008年11期
10 庞秀丽;冯玉强;姜维;;电子商务个性化文档推荐技术研究[J];中国管理科学;2008年S1期
相关博士学位论文 前3条
1 刘青文;基于协同过滤的推荐算法研究[D];中国科学技术大学;2013年
2 刘士琛;面向推荐系统的关键问题研究及应用[D];中国科学技术大学;2014年
3 张亮;推荐系统中协同过滤算法若干问题的研究[D];北京邮电大学;2009年
相关硕士学位论文 前10条
1 张晓旭;基于Hadoop的电子商务推荐系统研究[D];西安工业大学;2015年
2 李文龙;基于用户与服务特征的协同过滤推荐研究[D];山东大学;2014年
3 梁雪芬;基于数据挖掘的视频推荐技术研究[D];电子科技大学;2014年
4 孙远帅;基于大数据的推荐算法研究[D];厦门大学;2014年
5 戴思;基于可视化知识框架的视频推荐系统研究与实现[D];中南大学;2014年
6 朱文奇;推荐系统用户相似度计算方法研究[D];重庆大学;2014年
7 常江;基于Apache Mahout的推荐算法的研究与实现[D];电子科技大学;2013年
8 康钟荣;基于项目分类与预测填充的协同过滤推荐算法研究[D];北京化工大学;2013年
9 欧鹏杰;模糊聚类算法及其在协同过滤推荐中的应用[D];中南大学;2013年
10 代金龙;协同过滤算法中数据稀疏性问题研究[D];重庆大学;2013年
,本文编号:1441802
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1441802.html