基于用户协同过滤推荐算法的研究
本文关键词: 协同过滤 稀疏性 扩展性 冷启动 奇异值分解 聚类 出处:《天津大学》2016年硕士论文 论文类型:学位论文
【摘要】:随着“互联网+”的蓬勃发展和大数据时代的来临,网上购物已经成为人们日常生活的重要组成部分。如何快速有效的解决数据的搜索、分类、推荐,成为摆在人们面前亟需解决的问题。推荐系统能够根据用户的个人偏好,向用户提供个性化的服务推荐,从而使得广大用户能够迅速且准确地找到自己满意的商品或服务。尽管推荐系统近来取得了长足进步,但随着互联网用户数量的急剧增长,以及移动互联网的快速发展,推荐系统存在的缺陷和不足,更加制约着推荐系统的健康发展。本文针对基于用户协同过滤推荐系统所面临的稀疏性、扩展性、冷启动问题,通过将奇异值分解与聚类融合,并针对基于用户协同过滤推荐系统的特性,改进了相似性度量公式与Top-N推荐权值赋值系数,提出一种融合奇异值分解和聚类的协同过滤推荐算法—SCW(SVD Clustering Weight)算法。SCW算法主要融合了奇异值分解降维、聚类和Top-N推荐三个原理。具体研究内容可概括为以下几个方面:首先,本文利用奇异值分解从Movielens数据集中构建一个主题空间,然后在该空间中计算相似度。其次,对降维后的评分矩阵中的用户进行聚类,聚类分析将数据划分成有意义的簇。最后,完成聚类后,按照用户聚类的每个簇都是行为模式相似的用户,遍历目标用户所在簇的其他用户的物品集,去除目标用户物品集生成推荐列表。然后利用改进的预测评分公式计算推荐列表物品的预测评分,排序推荐。本文利用Moivelens公开数据集进行实验验证,并将本文的提出算法与传统的基于皮尔森相关度协同过滤算法和主成分分析算法进行对比。实验结果表明,本文提出的算法能够有效完成个性化推荐,提高了推荐准确率并降低了预测评分值的绝对值误差,在一定程度上解决了基于用户协同过滤推荐系统中存在的稀疏性、扩展性与冷启动问题。
[Abstract]:With the vigorous development of "Internet" and the advent of big data era, online shopping has become an important part of people's daily life. How to quickly and effectively solve the data search, classification, recommendation, Recommendation system can provide personalized service recommendation to users according to their personal preferences. As a result, the vast number of users can quickly and accurately find the goods or services they are satisfied with. Although the recommendation system has made great progress recently, with the rapid growth of the number of Internet users and the rapid development of the mobile Internet, The shortcomings and shortcomings of recommendation system restrict the healthy development of recommendation system. This paper aims at the problems of sparseness, expansibility and cold start of recommendation system based on user collaborative filtering, by combining singular value decomposition and clustering. According to the characteristics of user collaborative filtering recommendation system, the similarity measurement formula and the assignment coefficient of Top-N recommendation weight are improved. This paper proposes a collaborative filtering recommendation algorithm, SCWN SVD Clustering weight, which combines singular value decomposition and clustering. SCW algorithm mainly integrates three principles of singular value decomposition, clustering and Top-N recommendation. The specific research contents can be summarized as follows: firstly, In this paper, we use singular value decomposition to construct a topic space from the Movielens dataset, and then calculate the similarity in this space. Secondly, the users in the reduced dimension scoring matrix are clustered, and the data is divided into meaningful clusters by clustering analysis. After clustering, according to the user clustering each cluster is a user with similar behavior patterns, traversing the items set of other users of the target user cluster. The recommended list is generated by removing the target user item set, and then the prediction score of the recommended list item is calculated by the improved prediction scoring formula, and the recommendation is sorted. In this paper, Moivelens is used to expose the data set for experimental verification. The proposed algorithm is compared with the traditional Pearson correlation collaborative filtering algorithm and the principal component analysis algorithm. The experimental results show that the proposed algorithm can effectively complete personalized recommendation. The accuracy of recommendation is improved and the absolute error of prediction score is reduced. To some extent, the problems of sparseness, expansibility and cold start of recommendation system based on user collaborative filtering are solved.
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 徐义峰;陈春明;徐云青;;一种基于分类的协同过滤算法[J];计算机系统应用;2007年01期
2 杨风召;;一种基于特征表的协同过滤算法[J];计算机工程与应用;2007年06期
3 王岚;翟正军;;基于时间加权的协同过滤算法[J];计算机应用;2007年09期
4 曾子明;张李义;;基于多属性决策和协同过滤的智能导购系统[J];武汉大学学报(工学版);2008年02期
5 张富国;;用户多兴趣下基于信任的协同过滤算法研究[J];小型微型计算机系统;2008年08期
6 侯翠琴;焦李成;张文革;;一种压缩稀疏用户评分矩阵的协同过滤算法[J];西安电子科技大学学报;2009年04期
7 廖新考;;基于用户特征和项目属性的混合协同过滤推荐[J];福建电脑;2010年07期
8 沈磊;周一民;李舟军;;基于心理学模型的协同过滤推荐方法[J];计算机工程;2010年20期
9 徐红;彭黎;郭艾寅;徐云剑;;基于用户多兴趣的协同过滤策略改进研究[J];计算机技术与发展;2011年04期
10 焦晨斌;王世卿;;基于模型填充的混合协同过滤算法[J];微计算机信息;2011年11期
相关会议论文 前10条
1 沈杰峰;杜亚军;唐俊;;一种基于项目分类的协同过滤算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 张光卫;康建初;李鹤松;刘常昱;李德毅;;面向场景的协同过滤推荐算法[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
5 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 王明文;陶红亮;熊小勇;;双向聚类迭代的协同过滤推荐算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 罗喜军;王韬丞;杜小勇;刘红岩;何军;;基于类别的推荐——一种解决协同推荐中冷启动问题的方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
相关博士学位论文 前10条
1 纪科;融合上下文信息的混合协同过滤推荐算法研究[D];北京交通大学;2016年
2 程殿虎;基于协同过滤的社会网络推荐系统关键技术研究[D];中国海洋大学;2015年
3 于程远;基于QoS的Web服务推荐技术研究[D];上海交通大学;2015年
4 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
5 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年
6 罗恒;基于协同过滤视角的受限玻尔兹曼机研究[D];上海交通大学;2011年
7 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
8 高e,
本文编号:1553623
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1553623.html