基于项目云的个性化推荐算法研究
本文关键词:基于项目云的个性化推荐算法研究
更多相关文章: 推荐系统 协同过滤 项目云 有序秩聚类 评分可靠度
【摘要】:近年来,随着互联网科学技术的迅速崛起,网络数据与日俱增,随之而来的信息过载问题也日趋严重。因此,对于用户而言,从大量繁复的网络讯息中快速、准确获取目标信息是一项十分重要的任务。推荐系统作为信息过滤的重要手段,已经广泛应用于各大电子商务网站。然而,随着网络经济平台的扩大,网购人数急剧增多,网上商品种类不断增加,使得推荐系统的冷启动、稀疏性等缺陷逐渐显露。针对传统算法的不足,本文从定性分析和模糊聚类角度出发,构建出一套完整的基于项目云的个性化推荐系统。该系统巧妙融合云模型与有序秩聚类的优势,在传统算法的基础上提出一种基于项目云的有序秩聚类协同过滤推荐算法。本文设计的个性化推荐系统大致可以分成三大模块:数据预处理、有序秩聚类、预测和推荐。在数据预处理模块,本文通过云模型来拟合不同项目的分布情况及其统计分布特征,并用云发生器生成的缺失值来还原原始评分矩阵;其次,该算法将有序秩聚类算法与推荐系统相结合,用新定义的排序准则对项目云进行初步分类,生成有序云向量,为之后的相似度计算奠定基础;此外,本文选择“聚类-推荐”模式,在聚类簇内探索分析项目云之间的关系,进而生成推荐结果。同传统推荐算法相比,该算法主要做出了如下改进:第一,本文探索分析原始数据分布特征与数据缺失原理,给出合理的数据缺失机制假设;并通过云模型来拟合数据分布特征。第二,为从根本上缓解数据极端稀疏性,本文提出两种数据填充算法。一种是依据项目分布进行普通填充;另一种则是通过新定义的用户评分可靠度进行加权填充。对比两种不同的填充机制,判断用户评分可靠度对推荐结果的影响。第三,填充缺失值时,本文利用经验分布函数,对连续性随机数进行离散化转变成符合本研究数据打分机制的评分数。这一做法充分考虑到了项目本身的性质特征,依据其统计分布信息生成缺失值来还原原始评分矩阵,更能科学反映项目的评分特征。第四:本文首次将有序秩聚类算法与推荐系统相结合,根据新定义的排序准则对项目云进行有序秩聚类,不仅能提高推荐精度,且大大缩短了计算时间。传统推荐算法需要计算相似度nn?2)1(次,本文仅需n?1次。最后,为检验基于项目云的有序秩聚类协同过滤推荐算法的有效性,本文用R语言软件分别对MovieLens Data和Jester Joke Data进行试验。实证分析结果表明:新提出的数据填充机制能有效改善系统的极端稀疏性;基于项目云的有序秩聚类算法融入了云模型的不确定性,不仅可以缓解推荐系统的冷启动问题,而且能够更准确的定位同质项目,提高推荐精度;此外,有序秩聚类算法确实能够降低计算复杂度,提高推荐系统的可扩展性。因此,该算法的提出对于目前个性化推荐系统的研究与发展具有十分重要的意义。
【关键词】:推荐系统 协同过滤 项目云 有序秩聚类 评分可靠度
【学位授予单位】:太原理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
- 摘要3-5
- ABSTRACT5-9
- 第一章 绪论9-17
- 1.1 研究背景9-10
- 1.2 研究意义10-11
- 1.3 研究现状11-13
- 1.3.1 国外研究现状11-12
- 1.3.2 国内研究现状12-13
- 1.4 研究内容13-16
- 1.4.1 要解决的问题13-15
- 1.4.2 本文的工作15-16
- 1.5 论文的组织结构16-17
- 第二章 相关理论研究基础17-39
- 2.1 个性化推荐系统概述17-24
- 2.1.1 个性化推荐系统概念17-20
- 2.1.2 常用的个性化推荐技术20-24
- 2.2 推荐系统中的聚类算法的概述24-32
- 2.2.1 常见聚类算法的比较25-28
- 2.2.2 有序变量聚类算法简介28-31
- 2.2.3 相似度计算公式31-32
- 2.3 云模型概述32-39
- 2.3.1 云模型概念32-34
- 2.3.2 正态云概述34-39
- 第三章 基于项目云的个性化推荐算法39-53
- 3.1 数据预处理39-47
- 3.1.1 数据缺失机制假设39-40
- 3.1.2 数据分布假设40-42
- 3.1.3 改进的数据填充算法42-47
- 3.2 基于项目云的有序秩聚类47-49
- 3.2.1 相似度计算47-48
- 3.2.2 改进的项目云秩聚类48-49
- 3.3 预测和推荐49-53
- 第四章 实证分析53-63
- 4.1 试验目的及评价指标53-55
- 4.1.1 试验目的53-54
- 4.1.2 评价指标54-55
- 4.2 实验数据55-57
- 4.3 实验方案及结果分析57-62
- 4.3.1 试验方案57
- 4.3.2 结果分析57-62
- 4.4 本章小结62-63
- 第五章 总结与展望63-67
- 5.1 研究总结63-64
- 5.2 前景展望64-67
- 参考文献67-71
- 攻读硕士学位期间学术情况71-73
- A. 攻读硕士学位期间学术论文发表情况71
- B. 攻读硕士学位期间参与科研项目情况71-73
- 致谢73
【相似文献】
中国期刊全文数据库 前10条
1 徐义峰;徐云青;刘晓平;;一种基于时间序列性的推荐算法[J];计算机系统应用;2006年10期
2 余小鹏;;一种基于多层关联规则的推荐算法研究[J];计算机应用;2007年06期
3 张海玉;刘志都;杨彩;贾松浩;;基于页面聚类的推荐算法的改进[J];计算机应用与软件;2008年09期
4 张立燕;;一种基于用户事务模式的推荐算法[J];福建电脑;2009年03期
5 王晗;夏自谦;;基于蚁群算法和浏览路径的推荐算法研究[J];中国科技信息;2009年07期
6 周珊丹;周兴社;王海鹏;倪红波;张桂英;苗强;;智能博物馆环境下的个性化推荐算法[J];计算机工程与应用;2010年19期
7 王文;;个性化推荐算法研究[J];电脑知识与技术;2010年16期
8 张恺;秦亮曦;宁朝波;李文阁;;改进评价估计的混合推荐算法研究[J];微计算机信息;2010年36期
9 夏秀峰;代沁;丛丽晖;;用户显意识下的多重态度个性化推荐算法[J];计算机工程与应用;2011年16期
10 杨博;赵鹏飞;;推荐算法综述[J];山西大学学报(自然科学版);2011年03期
中国重要会议论文全文数据库 前10条
1 王韬丞;罗喜军;杜小勇;;基于层次的推荐:一种新的个性化推荐算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 唐灿;;基于模糊用户心理模式的个性化推荐算法[A];2008年计算机应用技术交流会论文集[C];2008年
3 秦国;杜小勇;;基于用户层次信息的协同推荐算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 周玉妮;郑会颂;;基于浏览路径选择的蚁群推荐算法:用于移动商务个性化推荐系统[A];社会经济发展转型与系统工程——中国系统工程学会第17届学术年会论文集[C];2012年
5 苏日启;胡皓;汪秉宏;;基于网络的含时推荐算法[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
6 梁莘q,
本文编号:783255
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/783255.html