基于奇异值分解和k-means聚类的电子商务推荐算法研究
发布时间:2017-05-24 06:03
本文关键词:基于奇异值分解和k-means聚类的电子商务推荐算法研究,由笔耕文化传播整理发布。
【摘要】:随着互联网的大规模覆盖和电子商务的飞速发展,不断膨胀的网络信息量和网络资源,将用户带入了一个信息过载的时代。伴随着持续增长的海量信息,网络用户无法迅速地找到自己真正需要的部分。如何从海量的资源中主动为用户定位和推送其可能感兴趣的内容是当前推荐系统的主要任务。推荐系统的最大优点在于能够快速推送用户真正感兴趣的资源,缓解了信息检索的压力。目前,在众多的推荐技术中,协同过滤推荐是其最为成功和应用最为广泛的推荐技术。在协同过滤推荐研究领域中,主要涉及的模型问题多数是数据的稀疏性和可扩展性,以及推荐精度的问题,而k-means聚类算法是一种无监督学习的算法具有良好分类性能,且适用范围广、算法简洁。然而面对数据矩阵稀疏性,聚类算法能有效地根据相似兴趣爱好将用户分配到相同的聚类簇中;聚类产生后,根据邻居用户预测评价目标用户对该商品的评价。但是由于数据稀疏,使得目标用户处在聚类的边缘,对该目标用户的推荐精度较低,鉴于此,本文首先采用奇异值分解技术化解数据稀疏性给数据对象聚类造成的不利影响;然后针对初始聚类中心的随机性,提出的改进算法与协同过滤算法进行融合,并对其进行仿真实验,实验验证了改进算法具有良好的推荐性能。基于奇异值分解的推荐算法的基本思想:首先以协同过滤算法为主体,针对出现的稀疏性数据造成的推荐精度低问题的基础上,采用奇异值分解技术,对评分矩阵进行降维处理,并结合着梯度下降法对用户和项目特征进行更新,有效的避免了过拟合现象的发生,同时克服了零评分用户对相似度计算时出现的推荐不精问题。通过MovieLence数据集的测试,并与传统的推荐时推荐算法进行对比,结果表明该算法在推荐精度方面有较好的改善。一种改进初始质心的k-means聚类算法的基本思想是:针对传统的k-means聚类算法k个初始聚类中心选择上的随机性,造成聚类结果的波动性,提出了一种能够生成比较稳定的初始聚类中心的改进算法;同时,借助均衡化函数有效寻找最佳k值。通过UCI数据集的仿真实验,并与传统k-means聚类算法进行比较,结果表明该改进算法有较好的性能。基于KSVD模型的推荐算法的基本思想是:在引入改进k-means聚类算法对数据对象进行分类处理时出现的高维稀疏性数据对算法造成的负面影响,采用奇异值分解技术,在另一空间进行信息传递重新表达数据。通过MovieLence数据集进行函数仿真,并与其它推荐算法进行对比,结果表明改进算法具有较好的寻优能力。
【关键词】:k-means聚类 奇异值分解 稀疏性数据 初始质心 梯度下降法
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F713.36
【目录】:
- 摘要6-8
- Abstract8-14
- 1 绪论14-21
- 1.1 研究背景及意义14-15
- 1.2 国内外研究现状15-18
- 1.2.1 推荐算法的研究现状15-16
- 1.2.2 奇异值分解算法的研究现状16-17
- 1.2.3 k-means聚类算法的研究现状17-18
- 1.3 论文的研究内容和创新点18-21
- 1.3.1 论文的主要研究内容及组织结构18-19
- 1.3.2 论文的创新点19-21
- 2 个性化推荐系统及相关技术21-31
- 2.1 个性化推荐系统21-23
- 2.1.1 个性化推荐系统的基本理论21-22
- 2.1.2 个性化推荐系统的组成22
- 2.1.3 个性化推荐系统的功能22-23
- 2.2 推荐算法相关理论23-26
- 2.2.1 推荐算法概述23-24
- 2.2.2 推荐算法流程24-25
- 2.2.3 推荐算法的应用25-26
- 2.3 推荐算法分类26-31
- 2.3.1 协同过滤推荐算法26-27
- 2.3.2 基于内容的推荐算法27-28
- 2.3.3 基于图结构的推荐算法28-29
- 2.3.4 混合推荐29-31
- 3 基于奇异值分解的推荐算法模型31-45
- 3.1 引言31-32
- 3.2 奇异值分解32-37
- 3.2.1 奇异值分解算法的概述32-34
- 3.2.2 奇异值分解的几点解释和标注34-35
- 3.2.3 基于SDM的奇异值分解算法35-37
- 3.3 相似度计算方法37-39
- 3.3.1 基于用户属性的相似度算法37-38
- 3.3.2 基于评分的相似度计算38-39
- 3.3.3 混合相似度计算39
- 3.4 推荐算法模型39-41
- 3.4.1 离线预处理评分矩阵39-40
- 3.4.2 在线搜索最近邻居查询40
- 3.4.3 算法时间复杂度40-41
- 3.5 实证研究和结果分析41-44
- 3.5.1 测试数据集41-42
- 3.5.2 性能评价标准42
- 3.5.3 实验结果分析42-44
- 3.6 小结44-45
- 4 一种改进初始质心的K-MEANS聚类算法45-55
- 4.1 引言45-46
- 4.2 K-MEANS聚类算法46-48
- 4.2.1 k-means聚类算法的概述46-48
- 4.2.2 k-means聚类算法的性能分析48
- 4.3 算法的改进策略48-52
- 4.3.1 初始质心的选择48-50
- 4.3.2 均衡化评价函数50
- 4.3.3 基于初始化中心点和均衡化函数的k-means算法50-51
- 4.3.4 算法的时间复杂度51-52
- 4.4 实验结果及分析52-54
- 4.4.1 初始聚类中心的验证52-53
- 4.4.2 均衡化函数实验结果53
- 4.4.3 算法性能比较53-54
- 4.5 小结54-55
- 5 KSVD模型55-62
- 5.1 引言55-56
- 5.2 KSVD模型实现56-57
- 5.3 实证研究和结果分析57-61
- 5.3.1 实验数据57-58
- 5.3.2 性能评价指标58
- 5.3.3 实验结果分析58-61
- 5.4 小结61-62
- 6 总结与展望62-64
- 6.1 总结62-63
- 6.2 对未来工作的展望63-64
- 参考文献64-68
- 在校期间发表的论文和科研成果68-69
- 致谢69
【参考文献】
中国期刊全文数据库 前4条
1 蔡浩;贾宇波;黄成伟;;结合用户信任模型的协同过滤推荐方法研究[J];计算机工程与应用;2010年35期
2 曾小波;魏祖宽;金在弘;;协同过滤系统的矩阵稀疏性问题的研究[J];计算机应用;2010年04期
3 吴颜;沈洁;顾天竺;陈晓红;李慧;张舒;;协同过滤推荐系统中数据稀疏问题的解决[J];计算机应用研究;2007年06期
4 刘丽;;基于改进的迭代式核方法协同过滤推荐算法研究[J];信息技术与信息化;2014年12期
中国硕士学位论文全文数据库 前2条
1 廖文彬;基于矩阵奇异值分解的图像压缩方法研究[D];成都理工大学;2007年
2 刘高英;基于位置信息的改进LEACH算法研究[D];东北大学;2010年
本文关键词:基于奇异值分解和k-means聚类的电子商务推荐算法研究,由笔耕文化传播整理发布。
,本文编号:389931
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/389931.html