基于聚类和矩阵分解的协同过滤算法研究
本文关键词:基于聚类和矩阵分解的协同过滤算法研究,,由笔耕文化传播整理发布。
【摘要】:互联网和电子商务的高速发展,带来了网站上的各种信息资源呈现指数级别增长,面对这些泛滥的信息,推荐系统在各大网站了得到了广泛的应用,推荐系统的核心为推荐算法,尤其是协同过滤推荐算法,该算法是当前应用最为成功的推荐算法之一,是一种基于用户显性评分行为的推荐技术。伴随着网站系统中用户与项目数量的迅速增长,其面临着数据稀疏性、冷启动和扩展性问题,论文针对传统协同过滤算法中出现的问题进行改进,引入了联合聚类和矩阵分解的方法,提出了一种基于联合聚类和矩阵分解的协同过滤改进方法。传统的协同过滤算法往往忽略了两个用户存在相似的品味只是针对部分项目这一点,而是计算了网站中的全部项目,面对该问题,该文引入了基于聚类的算法。首先对原始矩阵进行用户-项目两个维度的联合聚类,联合聚类后生成若干个子矩阵,子矩阵的规模与原始评分矩阵相比要小很多,并且同一子矩阵内部的评分具有相似性,可有效降低预测阶段计算量,而且也缓解了数据稀疏性问题。新数据加入后,只需要更新若干个子矩阵中的一个或多个矩阵的某个未知评分,可以及时将新评分作为可靠的依据再重新进行评分预测。然后,在预测阶段,选用基于矩阵分解的方法进行最后的评分预测。在子矩阵中通过对传统的矩阵分解进行正则化约束来防止模型过拟合现象,可有效缓解可扩展性。以常用的电影推荐为载体,在传统的矩阵分解(SVD)的基础上,深入挖掘数据集特点,加入全局偏置和社会兴趣随时间变化的影响,以提高预测精度。最后,在MovieLens数据集上进行聚类效果实验与评分预测实验,将该文提出的新算法与传统的协同过滤推荐算法进行多组对比实验,以此来说明该文算法的性能优劣。实验结果表明,该方法具有高效性。
【关键词】:联合聚类 协同过滤 相似性 矩阵分解 评分预测
【学位授予单位】:武汉轻工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
- 摘要4-5
- ABSTRACT5-9
- 1 绪论9-16
- 1.1 研究背景及意义9-10
- 1.2 国内外研究现状10-14
- 1.2.1 联合聚类研究现状10-12
- 1.2.2 协同过滤研究现状12-13
- 1.2.3 面临的主要问题和挑战13-14
- 1.3 论文的主要研究内容14-15
- 1.4 论文的组织结构15
- 1.5 本章小结15-16
- 2 协同过滤技术16-34
- 2.1 传统协同过滤推荐算法16-22
- 2.1.1 传统的协同过滤算法18-19
- 2.1.2 协同过滤推荐算法的基本流程19-20
- 2.1.3 用户相似度计算方法20-22
- 2.2 基于聚类的协同过滤技术22-28
- 2.2.1 基于项目聚类的协同过滤23-25
- 2.2.2 基于用户聚类的协同过滤25-27
- 2.2.3 基于用户和项目双重聚类的协同过滤27-28
- 2.3 矩阵分解方法28-30
- 2.4 评价标准和常用数据集30-33
- 2.4.1 评价标准30-32
- 2.4.2 常用数据集32-33
- 2.5 本章小结33-34
- 3 协同过滤算法研究和改进34-43
- 3.1 联合聚类算法的研究和改进35-37
- 3.2 增量更新机制及其改进37-38
- 3.3 矩阵分解推荐算法的研究和改进38-42
- 3.3.1 基于梯度下降法的矩阵分解38-39
- 3.3.2 加入全局偏置39-40
- 3.3.3 社会兴趣随时间变化40-42
- 3.4 本章小结42-43
- 4 算法实验与结果分析43-48
- 4.1 实验数据集43-44
- 4.2 联合聚类实验44-46
- 4.3 实验结果分析46-47
- 4.4 本章小结47-48
- 5 总结与展望48-50
- 5.1 总结48
- 5.2 展望48-50
- 参考文献50-55
- 致谢55-56
- 攻读学位期间的研究成果56
【相似文献】
中国期刊全文数据库 前10条
1 杨风召;;一种基于特征表的协同过滤算法[J];计算机工程与应用;2007年06期
2 王岚;翟正军;;基于时间加权的协同过滤算法[J];计算机应用;2007年09期
3 曾子明;张李义;;基于多属性决策和协同过滤的智能导购系统[J];武汉大学学报(工学版);2008年02期
4 张富国;;用户多兴趣下基于信任的协同过滤算法研究[J];小型微型计算机系统;2008年08期
5 侯翠琴;焦李成;张文革;;一种压缩稀疏用户评分矩阵的协同过滤算法[J];西安电子科技大学学报;2009年04期
6 廖新考;;基于用户特征和项目属性的混合协同过滤推荐[J];福建电脑;2010年07期
7 沈磊;周一民;李舟军;;基于心理学模型的协同过滤推荐方法[J];计算机工程;2010年20期
8 徐红;彭黎;郭艾寅;徐云剑;;基于用户多兴趣的协同过滤策略改进研究[J];计算机技术与发展;2011年04期
9 焦晨斌;王世卿;;基于模型填充的混合协同过滤算法[J];微计算机信息;2011年11期
10 郑婕;鲍海琴;;基于协同过滤推荐技术的个性化网络教学平台研究[J];科技风;2012年06期
中国重要会议论文全文数据库 前10条
1 沈杰峰;杜亚军;唐俊;;一种基于项目分类的协同过滤算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 张光卫;康建初;李鹤松;刘常昱;李德毅;;面向场景的协同过滤推荐算法[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
5 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 王明文;陶红亮;熊小勇;;双向聚类迭代的协同过滤推荐算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 罗喜军;王韬丞;杜小勇;刘红岩;何军;;基于类别的推荐——一种解决协同推荐中冷启动问题的方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
中国博士学位论文全文数据库 前10条
1 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
2 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年
3 罗恒;基于协同过滤视角的受限玻尔兹曼机研究[D];上海交通大学;2011年
4 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
5 高e
本文编号:456766
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/456766.html