基于机器学习的个人数据平台推荐系统的研究与实现

发布时间:2021-04-19 18:33
  随着信息技术的发展,人们越来越多使用互联网获取新闻,购物,观看影片等。伴随网络中的数据量急速增大,推荐系统成为了解决信息过载的重要方法。与此同时,“个人数据管理平台”抓取了用户在各个平台上的信息,拥有海量数据,如何利用这些数据对用户精准推荐也恰好是推荐系统的研究领域。目前,最为广泛应用的推荐算法是协同过滤算法。然而,该算法也面临诸多问题,如相似度模型较为朴素、预测过程未考虑用户偏好模型以及当项目增加时,有潜在的性能问题。基于以上的问题,本文对相似度模型、用户偏好模型和拓展性问题进行了研究,提出了一种改进的协同过滤推荐算法,取得了如下的主要研究成果:(1)在相似度度量问题上,提出了一种新的度量模型。该模型受NLP领域中的词嵌入思想的启发,分别通过将项目的共现信息与项目的简介信息分别映射到低维的向量空间中,得到关于项目的两种向量表示方法。最后将两种表示结合起来,按权重计算相似度。在项目共现的嵌入中,提出了f-item2vec模型,该模型引入了项目评分因子,进而增大高分项目的相似度;针对项目简介信息,先分词,然后使用doc2vec的方法训练项目的向量。与现有相似度模型相比,本文提出的相似度模... 

【文章来源】:北京工业大学北京市 211工程院校

【文章页数】:84 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
    1.3 本文主要研究内容与贡献
    1.4 本文的组织结构
第2章 相关理论与技术概述
    2.1 推荐系统概述
    2.2 基于内容的推荐算法
        2.2.1 基于内容的推荐算法的主要步骤
        2.2.2 基于内容的推荐算法的优缺点
    2.3 协同过滤推荐算法
        2.3.1 基于内存的协同过滤算法
        2.3.2 基于模型的协同过滤算法
    2.4 基于人口统计学的推荐算法
    2.5 本章小结
第3章 基于项目嵌入的相似度度量模型
    3.1 推荐系统中传统相似度度量方法
    3.2 基于项目嵌入的向量化方法
        3.2.1 基于项目共现的f-item2vec
        3.2.2 基于项目简介信息的向量化方法
    3.3 组合特征相似度度量模型
    3.4 实验及结果分析
        3.4.1 数据集与评价标准
        3.4.2 实验设计与结果分析
    3.5 本章小结
第4章 基于长短期兴趣的用户偏好模型
    4.1 用户偏好模型概述
    4.2 用户偏好模型的理论基础
    4.3 用户偏好模型
        4.3.1 短期兴趣权重
        4.3.2 长期兴趣权重
        4.3.3 用户偏好模型与评分方法
    4.4 实验及结果分析
        4.4.1 数据集与评价指标
        4.4.2 实验设计与结果分析
    4.5 本章小结
第5章 基于聚类的协同过滤推荐模型
    5.1 聚类过程
        5.1.1 生成S个初始聚类中心
        5.1.2 使用K-means算法聚类
    5.2 改进的协同过滤算法模型
    5.3 实验及结果分析
        5.3.1 实验数据集
        5.3.2 实验评价指标
        5.3.3 实验设计
        5.3.4 模型在MAE上的结果对比与时间开销
        5.3.5 模型在Precision上的结果对比
        5.3.6 模型在Recall上的结果对比
    5.4 本章小结
第6章 基于改进协同过滤的推荐原型系统的设计实现
    6.1 系统开发环境与平台
    6.2 系统概要设计
    6.3 系统数据库设计
    6.4 核心模块设计
        6.4.1 离线处理模块
        6.4.2 在线推荐模块
        6.4.3 个人信息管理模块
        6.4.4 相似项目推荐模块
    6.5 原型系统实现
        6.5.1 离线处理模块
        6.5.2 在线推荐模块
        6.5.3 个人信息管理模块
        6.5.4 相似项目推荐模块
    6.6 本章小结
结论
参考文献
攻读硕士学位期间取得的研究成果
致谢


【参考文献】:
期刊论文
[1]国外网络环境中信息过载研究进展[J]. 郭佳,黄程松.  情报科学. 2018(07)
[2]基于标签聚类与项目主题的协同过滤推荐算法[J]. 李昊阳,符云清.  计算机科学. 2018(04)
[3]基于阶段时序效应的奇异值分解推荐模型[J]. 黄凯,张曦煌.  计算机应用. 2017(05)
[4]一种基于贝叶斯网络的个性化协同过滤推荐方法研究[J]. 付永平,邱玉辉.  计算机科学. 2016(09)
[5]TF-IDF与规则相结合的中文关键词自动抽取研究[J]. 牛萍,黄德根.  小型微型计算机系统. 2016(04)
[6]基于BP神经网络的情境化信息推荐服务研究[J]. 周朴雄,张兵荣,赵龙文.  情报科学. 2016(03)
[7]基于用户模糊相似度的协同过滤算法[J]. 吴毅涛,张兴明,王兴茂,李晗.  通信学报. 2016(01)
[8]Time-Ordered Collaborative Filtering for News Recommendation[J]. XIAO Yingyuan,AI Pengqiang,Ching-Hsien Hsu,WANG Hongya,JIAO Xu.  中国通信. 2015(12)
[9]大数据环境下的推荐系统[J]. 孟祥武,纪威宇,张玉洁.  北京邮电大学学报. 2015(02)
[10]协同过滤推荐技术综述[J]. 冷亚军,陆青,梁昌勇.  模式识别与人工智能. 2014(08)



本文编号:3148087

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3148087.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4bef6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com