基于内容和协同过滤的混合算法在推荐系统中的应用研究
本文选题:推荐系统 切入点:协同过滤算法 出处:《东华大学》2016年硕士论文 论文类型:学位论文
【摘要】:在电子商务为越来越多用户提供便利的同时,它的结构也越发复杂。用户拥有了更大的选择空间,然而海量信息的同时呈现,也让用户无法快速准确地寻找到自己想要的商品。推荐系统就是为解决这样的困境产生的,它能为用户个性化定制,产生用户希望看到的结果。如今,几乎所有的电子商务网站都应用了推荐系统,例如淘宝、ePay等。为了能产生更高的推荐质量,技术人员已经提出了多种推荐技术,包括基于内容的推荐,协同过滤推荐,关联挖掘推荐等。然而随着研究的深入以及用户要求的提升,推荐算法渐渐暴露了诸多缺点,例如协同过滤推荐的冷启动和数据稀疏性问题、推荐质量和实时性的平衡等。本文主要对基于内容和协同过滤算法进行研究,具体内容如下:(1)对推荐算法的发展情况及关键技术进行综述;(2)针对协同过滤算法运行时间长、推荐速度慢的缺陷,提出了将k-means聚类应用于协同过滤算法,通过离线预处理用户—项目评分矩阵对用户进行聚类,并生成虚拟用户空间,替代全部用户的集合,缩小了邻居用户的搜寻范围,可以提高在线推荐的实时性,解决了传统协同过滤算法的速度瓶颈问题;(3)在改进后协同过滤算法的基础上,提出了基于内容和改进后协同过滤的混合算法,将用户评分和项目特征相结合,建立用户特征评分矩阵,替代传统的用户—项目评分矩阵,对用户集进行k-means聚类,并进行推荐。改进后的算法不仅能解决传统协同过滤算法的数据稀疏性问题;同时针对新项目,也能根据项目特征与用户特征评分矩阵的匹配,来预测可能对新项目感兴趣的用户,并生成推送列表,有效解决“冷启动”中的新项目问题。实验证明,本文改进的算法在解决数据稀疏、冷启动和在线推荐的速度瓶颈问题方面,有显著的作用,能保证较好的推荐质量。
[Abstract]:While e-commerce provides convenience for more and more users, its structure is becoming more and more complicated. It also makes it impossible for users to find the product they want quickly and accurately. Recommendation systems are created to solve this dilemma. It can be customized for the user and produce the results that the user wants to see. Today, Almost all e-commerce websites use recommendation systems, such as Taobao ePay. In order to generate higher recommendation quality, technicians have proposed a variety of recommendation technologies, including content-based recommendations, collaborative filtering recommendations, etc. However, with the deepening of research and the improvement of user requirements, the recommendation algorithm gradually exposes many shortcomings, such as cold start of collaborative filtering recommendation and data sparsity. This paper mainly studies the content-based and collaborative filtering algorithms, which are as follows: (1) A review of the development and key technologies of the recommendation algorithms; (2) the long running time of the collaborative filtering algorithms. In this paper, we apply k-means clustering to collaborative filtering algorithm, and cluster users by off-line preprocessing user-item scoring matrix, and generate virtual user space to replace the set of all users. It reduces the search range of neighbor users, improves the real-time performance of online recommendation, and solves the speed bottleneck problem of traditional collaborative filtering algorithm based on the improved collaborative filtering algorithm. A hybrid algorithm based on content and improved collaborative filtering is proposed, which combines user score with item feature, establishes user feature scoring matrix, replaces the traditional user-item scoring matrix, and carries out k-means clustering on user set. The improved algorithm can not only solve the data sparsity problem of the traditional collaborative filtering algorithm, but also match the scoring matrix according to the item features and user characteristics. To predict users who might be interested in new projects, and generate push lists to effectively solve the problem of new projects in "cold start". Experiments show that the improved algorithm in this paper is to solve the problem of sparse data. The speed bottleneck of cold start and online recommendation plays a significant role in ensuring better recommendation quality.
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 张付志;张启凤;;融合多系统用户信息的协同过滤算法[J];计算机工程;2009年21期
2 周丽娟;徐明升;张研研;张璋;;基于协同过滤的课程推荐模型[J];计算机应用研究;2010年04期
3 刘淇;陈恩红;;结合二部图投影与排序的协同过滤[J];小型微型计算机系统;2010年05期
4 董全德;;基于双信息源的协同过滤算法研究[J];合肥工业大学学报(自然科学版);2010年07期
5 李聪;;电子商务协同过滤可扩展性研究综述[J];现代图书情报技术;2010年11期
6 傅鹤岗;李冉;;基于用户实时反馈的协同过滤算法[J];计算机应用;2011年07期
7 辛勤芳;;基于项目聚类的协同过滤算法研究[J];赤峰学院学报(自然科学版);2011年09期
8 杨君;汪会玲;艾丹祥;;一种基于情景的多维协同过滤新方法研究[J];图书情报工作;2011年21期
9 王宗武;;基于信任用户联合聚类的协同过滤算法[J];计算机与现代化;2013年09期
10 杜永萍;黄亮;何明;;融合信任计算的协同过滤推荐方法[J];模式识别与人工智能;2014年05期
相关会议论文 前10条
1 沈杰峰;杜亚军;唐俊;;一种基于项目分类的协同过滤算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 张光卫;康建初;李鹤松;刘常昱;李德毅;;面向场景的协同过滤推荐算法[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
5 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 王明文;陶红亮;熊小勇;;双向聚类迭代的协同过滤推荐算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 罗喜军;王韬丞;杜小勇;刘红岩;何军;;基于类别的推荐——一种解决协同推荐中冷启动问题的方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
相关博士学位论文 前10条
1 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
2 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年
3 罗恒;基于协同过滤视角的受限玻尔兹曼机研究[D];上海交通大学;2011年
4 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
5 高e,
本文编号:1637259
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1637259.html