基于k-means用户聚类的混合协同过滤算法的研究
本文关键词:基于k-means用户聚类的混合协同过滤算法的研究,,由笔耕文化传播整理发布。
【摘要】:近几年,随着电子商务的飞速发展与互联网的普及,人们的生活越来越方便,可以在足不出户的情况下选择自己想要的商品,电子商务系统也不断地为消费者供给商品与服务。但是,随着用户的不断增加,电子商务系统提供商品的种类信息等也不断地增加,虽然用户可以方便的选择各种各样的商品,但如今用户很难在众多的信息中准确迅速地找到自己感兴趣的商品,此时,电子商务推荐系统的改进与优化迫在眉睫。如今已存在很多推荐算法,主要可以分为以用户主观为标准的个性化推荐,以及与用户主观意向无关的非个性化推荐算法,相应地推荐系统也可以被分为非个性化推荐和个性化推荐系统。推荐系统所提供的个性化推荐是根据用户的历史行为给予推荐,而非个性化推荐则不考虑用户历史数据。本文主要研究的是个性化推荐算法中的协同过滤,由于传统的协同过滤具有一些缺点,本文针对其缺点进行一些相应改进,主要工作如下:首先,采用最传统且使用最为广泛的推荐算法,即协同过滤推荐算法。协同过滤推荐算法可分为基于用户的协同过滤推荐算法和基于项目的协同过滤推荐算法两种。第一种是通过计算用户之间的相似性进行推荐的,而另一种是通过计算项目之间的相似性进行推荐的,本文主要采用的是基于用户的协同过滤。其次,采用混合协同过滤推荐算法。针对基于用户的协同过滤推荐算法的稀疏性进行优化。在现实生活中,用户对项目的评分只是其中的小部分,使得评分数据非常稀疏,这将导致用户相似度的计算存在着很大的误差,很难准确的找到用户的“邻居”,直接影响着推荐结果的准确性。本文根据项目的相似性进行评分预测,解决评分矩阵的稀疏性,再根据近邻用户的行为实施推荐。最后,由于电子商务的飞速发展,用户与项目都不断增加,导致在使用协同过滤推荐算法时计算相似性的效率低、推荐不及时等问题的出现。为更好的解决此问题,本文提出结合数据挖掘算法。首先使用k-means用户聚类,根据用户的行为习惯把用户分成不同的簇,然后使用项目相似性解决评分矩阵的稀疏性,最后在此基础上使用协同过滤推荐算法,先判断用户具体属于哪个簇,在簇内计算用户相似性。这样,将最大限度的减少计算量,提高推荐算法的效率,并且经过最终实验结果验证,此优化方式将提高算法的准确性。
【关键词】:电子商务 协同过滤 k-means算法 聚类
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
- 摘要4-6
- abstract6-11
- 第1章 绪论11-15
- 1.1 研究背景11
- 1.2 电子商务研究现状11-13
- 1.2.1 数据挖掘11-12
- 1.2.2 电子商务12-13
- 1.3 本文研究内容13-14
- 1.4 本文研究结构14-15
- 第2章 传统的数据挖掘算法与推荐算法15-32
- 2.1 电子商务推荐系统15-16
- 2.2 数据挖掘相关算法16-24
- 2.2.1 K最近邻算法16-17
- 2.2.2 朴素贝叶斯算法17-18
- 2.2.3 PageRank算法18-20
- 2.2.4 Apriori算法20-24
- 2.3 个性化推荐算法24-26
- 2.3.1 基于内容的推荐24-25
- 2.3.2 基于关联规则的推荐25
- 2.3.3 基于效用的推荐25-26
- 2.3.4 基于知识的推荐26
- 2.4 协同过滤推荐算法26-31
- 2.4.1 相关概念27-28
- 2.4.2 基于用户的协同过滤推荐算法28-29
- 2.4.3 基于项目的协同过滤推荐算法29-30
- 2.4.4 混合协同过滤推荐算法30-31
- 2.5 本章小结31-32
- 第3章 混合协同过滤推荐算法的研究32-38
- 3.1 优化背景32
- 3.2 算法描述32-35
- 3.2.1 基于用户的协同过滤推荐算法32-33
- 3.2.2 混合协同过滤推荐算法33-35
- 3.3 实验及分析35-36
- 3.3.1 实验数据35
- 3.3.2 度量标准35-36
- 3.3.3 结果分析36
- 3.4 本章总结36-38
- 第4章 基于聚类的混合协同过滤推荐算法的研究38-47
- 4.1 优化背景38
- 4.2 k-means算法38-40
- 4.3 算法描述40-44
- 4.3.1 k-means用户聚类40-41
- 4.3.2 基于k-means用户聚类的混合协同过滤算法41-44
- 4.4 结果分析44-45
- 4.5 本章小结45-47
- 第5章 总结与展望47-49
- 5.1 总结47
- 5.2 展望47-49
- 参考文献49-52
- 致谢52
【相似文献】
中国期刊全文数据库 前10条
1 杨风召;;一种基于特征表的协同过滤算法[J];计算机工程与应用;2007年06期
2 王岚;翟正军;;基于时间加权的协同过滤算法[J];计算机应用;2007年09期
3 曾子明;张李义;;基于多属性决策和协同过滤的智能导购系统[J];武汉大学学报(工学版);2008年02期
4 张富国;;用户多兴趣下基于信任的协同过滤算法研究[J];小型微型计算机系统;2008年08期
5 侯翠琴;焦李成;张文革;;一种压缩稀疏用户评分矩阵的协同过滤算法[J];西安电子科技大学学报;2009年04期
6 廖新考;;基于用户特征和项目属性的混合协同过滤推荐[J];福建电脑;2010年07期
7 沈磊;周一民;李舟军;;基于心理学模型的协同过滤推荐方法[J];计算机工程;2010年20期
8 徐红;彭黎;郭艾寅;徐云剑;;基于用户多兴趣的协同过滤策略改进研究[J];计算机技术与发展;2011年04期
9 焦晨斌;王世卿;;基于模型填充的混合协同过滤算法[J];微计算机信息;2011年11期
10 郑婕;鲍海琴;;基于协同过滤推荐技术的个性化网络教学平台研究[J];科技风;2012年06期
中国重要会议论文全文数据库 前10条
1 沈杰峰;杜亚军;唐俊;;一种基于项目分类的协同过滤算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 张光卫;康建初;李鹤松;刘常昱;李德毅;;面向场景的协同过滤推荐算法[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
5 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 王明文;陶红亮;熊小勇;;双向聚类迭代的协同过滤推荐算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 罗喜军;王韬丞;杜小勇;刘红岩;何军;;基于类别的推荐——一种解决协同推荐中冷启动问题的方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
中国博士学位论文全文数据库 前10条
1 纪科;融合上下文信息的混合协同过滤推荐算法研究[D];北京交通大学;2016年
2 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
3 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年
4 罗恒;基于协同过滤视角的受限玻尔兹曼机研究[D];上海交通大学;2011年
5 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
6 高e
本文编号:383437
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/383437.html