基于协同过滤算法的个性化推荐技术研究
发布时间:2017-04-02 16:02
本文关键词:基于协同过滤算法的个性化推荐技术研究,由笔耕文化传播整理发布。
【摘要】:随着互联网的飞速发展,网络数据迅速膨胀,信息超载和信息迷航的问题日益突出,用户想要快速地从众多的数据中找到符合自己需求的信息越来越难。为了解决这个问题,研究者们提出了个性化推荐技术解决方案,其中应用最为广泛的是协同过滤推荐技术,但该技术中存在的用户兴趣迁移、冷启动、数据稀疏、可扩展性等问题,严重影响着推荐结果的准确性,所以如何解决这些问题是当前研究的重点。本文针对协同过滤技术中存在的数据稀疏、用户兴趣迁移和可扩展性问题对协同过滤算法进行改进,主要工作如下:(1)协同过滤算法的推荐效果往往会受到用户兴趣变化的影响,针对此问题,本文构建了一个基于用户类型偏好的兴趣迁移模型。该模型考虑用户对不同类型项目的偏好程度,根据评分时间对不同类型项目的评分进行不同速度的衰减。利用衰减后的项目评分矩阵进行用户相似度的计算和评分预测,有效地缓解了用户兴趣变化对推荐精确度的影响。(2)构建了一个适合协同过滤推荐算法的信任模型。该模型充分考虑了时间因素和用户评分数量对信任度的影响,利用T-采用率和可信度指标来计算用户之间的直接信任度和间接信任度。将信任度与基于时间的用户相似度进行线性组合,根据组合后的综合权重进行项目的预测和推荐,有效地解决了数据稀疏影响推荐精确度的问题。(3)针对协同过滤算法存在的可扩展性问题,本文利用K-means聚类算法对用户进行聚类,并提出了一种基于熵值法的用户属性相似度计算方法。该方法考虑不同属性对区分用户的贡献程度不同,准确地计算了用户之间的属性相似度,有效提高了聚类结果的准确性。(4)本文利用Movie Lens数据集设计了一系列实验对提出的改进算法进行验证。实验结果证明,本文提出的改进算法能够有效地提高推荐的准确性和可扩展性。
【关键词】:个性化推荐 协同过滤 兴趣迁移 信任度 用户聚类
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
- 摘要4-5
- Abstract5-8
- 第1章 绪论8-14
- 1.1 研究背景和研究意义8-9
- 1.1.1 研究背景8-9
- 1.1.2 研究意义9
- 1.2 国内外研究现状9-12
- 1.3 本文研究工作12
- 1.4 文章组织结构12-14
- 第2章 个性化推荐的相关理论和技术14-26
- 2.1 个性化推荐的概念14
- 2.2 个性化推荐技术14-17
- 2.2.1 基于关联规则的推荐算法14-15
- 2.2.2 基于内容的推荐算法15-16
- 2.2.3 基于协同过滤的推荐算法16
- 2.2.4 基于混合策略的推荐算法16-17
- 2.3 常用协同过滤算法17-23
- 2.3.1 基于内存的协同过滤17-21
- 2.3.2 基于模型的协同过滤21-22
- 2.3.3 算法的比较22-23
- 2.4 推荐结果的测评指标23-24
- 2.5 本章小结24-26
- 第3章 基于时间与信任度的协同过滤算法研究26-40
- 3.1 优化的算法设计思想论述26-29
- 3.1.1 用户兴趣迁移模型的引入26
- 3.1.2 用户信任模型的引入26-29
- 3.2 基于时间的用户相似度计算29-32
- 3.2.1 用户兴趣迁移模型的构建29-31
- 3.2.2 用户相似度计算31-32
- 3.3 用户的信任度建模32-35
- 3.3.1 直接信任度建模32-33
- 3.3.2 间接信任度建模33-35
- 3.4 相似-信任度计算35-36
- 3.5 算法描述36-38
- 3.6 本章小结38-40
- 第4章 融合聚类和协同过滤的个性化推荐算法研究40-52
- 4.1 传统基于用户聚类的协同过滤算法40-43
- 4.1.1 K-means聚类算法40-42
- 4.1.2 算法的思想概述42-43
- 4.2 优化的算法设计思想论述43-45
- 4.3 基于用户特征属性的K-means聚类45-48
- 4.3.1 基于熵值法的用户属性相似度计算45-47
- 4.3.2 基于用户属性相似度的K-means聚类47-48
- 4.4 算法描述48-50
- 4.5 本章小结50-52
- 第5章 实验及结果分析52-62
- 5.1 实验目的52
- 5.2 实验环境及实验数据52-54
- 5.2.1 实验环境52
- 5.2.2 实验数据52-54
- 5.3 评价指标54-55
- 5.3.1 平均绝对误差54
- 5.3.2 数据稀疏度54-55
- 5.3.3 最近邻查找效率55
- 5.4 实验设计及结果分析55-60
- 5.4.1 时间权重因子的确定55-56
- 5.4.2 信任传递长度的确定56-57
- 5.4.3 信任度权重的确定57-58
- 5.4.4 最佳聚类数的确定58-59
- 5.4.5 最近邻查找效率比较59
- 5.4.6 改进算法与传统算法的MAE比较59-60
- 5.5 本章小结60-62
- 结论62-64
- 参考文献64-68
- 攻读硕士学位期间发表的学术论文68-70
- 致谢70
本文关键词:基于协同过滤算法的个性化推荐技术研究,由笔耕文化传播整理发布。
,本文编号:282736
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/282736.html