基于混合相似度及专注力编码机制的推荐系统算法研究
发布时间:2021-08-18 16:53
推荐系统是一种在当前互联网信息产业中应用较为广泛的系统。面对多种多样的推荐系统应用场景,数据特征和启动状态,协同过滤推荐算法面临一系列严峻的问题,这些问题包含但不仅限于冷启动问题、用户/物品矩阵稀疏和维度爆炸问题、用户-物品组织的长尾分布问题、用户选择的相似度度量问题等。本文针对当前协同过滤推荐算法存在的问题,通过引入混合相似度度量方法、结合专注力编码机制对用户行为数据编码等方法,一定程度上缓解了传统推荐算法普遍存在的冷启动和用户/物品矩阵稀疏问题。本文提出的基于混合相似度及专注力神经网络编码的推荐算法(ACFSI)在Movie Lens 1M数据集上相较于传统推荐算法展现出更加高效、准确的推荐效果。本文的工作主要有:(1)提出一种基于混合相似度的协同过滤推荐算法(CFSI),该算法提升了协同过滤算法计算过程中面向用户、物品计算相似度时的准确度;通过研究传统相似度度量方法,归纳和总结各种相似度度量方法对于用户特征对比的侧重点,寻找兼顾多种特征表达角度的混合相似度度量方法,该方法能够合理兼顾物品自身独有特征和同类型物品共有特征,有效规避噪音。同时通过该算法,缓解了冷启动现象对于推荐系统准...
【文章来源】:西华师范大学四川省
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
WalterPitts神经网络模型
第2章CFSI算法—基于混合相似度的协同过滤推荐算法72.2推荐系统的架构本节介绍推荐系统的基本架构,主要讲推荐系统架构按照数据训练的工作流程区分,主要分为离线训练在线推荐的推荐系统架构和在线训练和推荐的推荐系统架构。2.2.1离线推荐的架构基于离线训练的推荐系统结构是当前比较流行的推荐系统架构,其离线训练-实时推荐的运行特征将模型的参数调整和实际运行分离开来,这种分离使得整个系统架构较为简单[14]。在具体系统运行流程上,主要分为数据上报、离线训练、在线存储和实时推荐几个主要流程,同时,为了保证系统在运营过程中能够及时调整,也有评估和测试模块。如图2-1所示,是一个离线推荐推荐系统的基本架构。图2-1离线推荐系统的基本结构Fig.2-1Basicstructureofofflinerecommendationsystem数据上报和离线训练系统通过一条数据流构成了一个典型的监督学习系统,该系统是训练、调整推荐系统模型的关键。监督学习系统最终构成“模型”,同时,模型匹配了一个在线存储系统存储需要在线使用的数据(例如基于KNN或者某些需要在预测过程中使用到离线数据集的系统)进行实时推荐;同时,AB测试处理直接来自于业务的数据流,构成对模型的测试。各个部分的主要功能和特征如下:1、数据上报数据上报是对业务来源数据的数据处理模块,一般而言,数据集需要进行一系列收集、验证、清洗、转换和存储。数据上报属于推荐系统的信息预处理阶段,由于当前各种推荐系统面临的业务数据流多是多模态、时序相关的混合数据,所以数据上报和数据预处理是相当重要的,在后文中将着重研究数据的预处理,重组织等任务。常见的数据上报流程如图2-2所示。
第2章CFSI算法—基于混合相似度的协同过滤推荐算法8图2-2常见的数据上报和预处理过程Fig.2-2Commondatareportingandpre-processing2、离线训练离线训练是推荐系统的重要组成部分,一般而言是一个模式识别引擎,配合与之相关的特征工程模块、数据预处理模块和样本抽样等模块。离线训练是整个推荐系统生命周期当中较长时间运行的模块,一般而言,离线训练模块在没有用户请求推荐的时候长期驻留在系统中,使用离线数据训练自身模式引擎。结合测试模块不断调优。训练模块能够对给定输入给出符合用户特征的推荐。3、在线存储在线存储在离线训练类型的推荐系统中的地位比较特殊,由于离线系统的大部分数据、程序都以离线方式运行,模式学习引擎并不会直接接手参与实时推荐,但是用户的推荐请求一般要求实时的反溃在线存储模块将相关功能和数据在线存储,为实时推荐模块提供数据和模型支持。4、实时推荐实时推荐是直接与用户对接的模块。主要有三个工作:一、接受用户请求,用户对于推荐的请求直接传达给实时推荐模块,例如搜索引擎的请求;二、调用推荐引擎进行推荐,实时推荐模块并不能够独立执行推荐工作,需要将请求递交给由在线存储模块和离线学习模块组成的推荐引擎处理;三、结果排序,一般而言,推荐引擎给出一个推荐结果列表(List),该列表中的物品(Item)是和用户请求高度相关的物品。实时推荐模块需要给该结果列表排序。图2-3展示了实时推荐模块的主要任务和运行流程。
【参考文献】:
期刊论文
[1]动态惯性权重粒子群算法研究与实现[J]. 李亮. 信息化研究. 2019(05)
[2]深度学习在旋转机械设备故障诊断中的应用研究综述[J]. 吴春志,冯辅周,吴守军,陈汤,王杰. 噪声与振动控制. 2019(05)
[3]结合实时推荐与离线推荐的推荐系统[J]. 李亚欣,蔡永香,张根. 计算机系统应用. 2019(10)
[4]门控递归单元神经网络坐标变换盲均衡算法[J]. 魏海文,郭业才. 微电子学与计算机. 2019(09)
[5]知识找回场景下推荐系统模拟实现及评价研究[J]. 程秀峰,张孜铭,孟亚琪,范晓莹,杨金庆. 图书情报工作. 2019(16)
[6]基于人工神经网络的运动机构可靠性灵敏度分析[J]. 唐成虎,张建华,侯伟,张晶辉,王克平,张烽彪. 锻压技术. 2019(08)
[7]基于多层感知器的流量分类方法研究[J]. 郭丽,刘磊. 电子测量与仪器学报. 2019(07)
[8]基于改进CNN的局部相似性预测推荐模型[J]. 吴国栋,宋福根,涂立静,史明哲. 计算机工程与科学. 2019(06)
[9]基于异步优势执行器评价器学习的自适应PID控制设计[J]. 孙歧峰,任辉,段友祥. 信息与控制. 2019(03)
[10]基于广义回归神经网络的微生物降解效应对助燃剂检测的影响[J]. 方强,刘玲. 色谱. 2019(06)
博士论文
[1]基于多样化内容数据的个性化推荐系统[D]. 练建勋.中国科学技术大学 2018
硕士论文
[1]基于Spark平台的推荐系统的研究与实现[D]. 王水德.厦门大学 2017
本文编号:3350264
【文章来源】:西华师范大学四川省
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
WalterPitts神经网络模型
第2章CFSI算法—基于混合相似度的协同过滤推荐算法72.2推荐系统的架构本节介绍推荐系统的基本架构,主要讲推荐系统架构按照数据训练的工作流程区分,主要分为离线训练在线推荐的推荐系统架构和在线训练和推荐的推荐系统架构。2.2.1离线推荐的架构基于离线训练的推荐系统结构是当前比较流行的推荐系统架构,其离线训练-实时推荐的运行特征将模型的参数调整和实际运行分离开来,这种分离使得整个系统架构较为简单[14]。在具体系统运行流程上,主要分为数据上报、离线训练、在线存储和实时推荐几个主要流程,同时,为了保证系统在运营过程中能够及时调整,也有评估和测试模块。如图2-1所示,是一个离线推荐推荐系统的基本架构。图2-1离线推荐系统的基本结构Fig.2-1Basicstructureofofflinerecommendationsystem数据上报和离线训练系统通过一条数据流构成了一个典型的监督学习系统,该系统是训练、调整推荐系统模型的关键。监督学习系统最终构成“模型”,同时,模型匹配了一个在线存储系统存储需要在线使用的数据(例如基于KNN或者某些需要在预测过程中使用到离线数据集的系统)进行实时推荐;同时,AB测试处理直接来自于业务的数据流,构成对模型的测试。各个部分的主要功能和特征如下:1、数据上报数据上报是对业务来源数据的数据处理模块,一般而言,数据集需要进行一系列收集、验证、清洗、转换和存储。数据上报属于推荐系统的信息预处理阶段,由于当前各种推荐系统面临的业务数据流多是多模态、时序相关的混合数据,所以数据上报和数据预处理是相当重要的,在后文中将着重研究数据的预处理,重组织等任务。常见的数据上报流程如图2-2所示。
第2章CFSI算法—基于混合相似度的协同过滤推荐算法8图2-2常见的数据上报和预处理过程Fig.2-2Commondatareportingandpre-processing2、离线训练离线训练是推荐系统的重要组成部分,一般而言是一个模式识别引擎,配合与之相关的特征工程模块、数据预处理模块和样本抽样等模块。离线训练是整个推荐系统生命周期当中较长时间运行的模块,一般而言,离线训练模块在没有用户请求推荐的时候长期驻留在系统中,使用离线数据训练自身模式引擎。结合测试模块不断调优。训练模块能够对给定输入给出符合用户特征的推荐。3、在线存储在线存储在离线训练类型的推荐系统中的地位比较特殊,由于离线系统的大部分数据、程序都以离线方式运行,模式学习引擎并不会直接接手参与实时推荐,但是用户的推荐请求一般要求实时的反溃在线存储模块将相关功能和数据在线存储,为实时推荐模块提供数据和模型支持。4、实时推荐实时推荐是直接与用户对接的模块。主要有三个工作:一、接受用户请求,用户对于推荐的请求直接传达给实时推荐模块,例如搜索引擎的请求;二、调用推荐引擎进行推荐,实时推荐模块并不能够独立执行推荐工作,需要将请求递交给由在线存储模块和离线学习模块组成的推荐引擎处理;三、结果排序,一般而言,推荐引擎给出一个推荐结果列表(List),该列表中的物品(Item)是和用户请求高度相关的物品。实时推荐模块需要给该结果列表排序。图2-3展示了实时推荐模块的主要任务和运行流程。
【参考文献】:
期刊论文
[1]动态惯性权重粒子群算法研究与实现[J]. 李亮. 信息化研究. 2019(05)
[2]深度学习在旋转机械设备故障诊断中的应用研究综述[J]. 吴春志,冯辅周,吴守军,陈汤,王杰. 噪声与振动控制. 2019(05)
[3]结合实时推荐与离线推荐的推荐系统[J]. 李亚欣,蔡永香,张根. 计算机系统应用. 2019(10)
[4]门控递归单元神经网络坐标变换盲均衡算法[J]. 魏海文,郭业才. 微电子学与计算机. 2019(09)
[5]知识找回场景下推荐系统模拟实现及评价研究[J]. 程秀峰,张孜铭,孟亚琪,范晓莹,杨金庆. 图书情报工作. 2019(16)
[6]基于人工神经网络的运动机构可靠性灵敏度分析[J]. 唐成虎,张建华,侯伟,张晶辉,王克平,张烽彪. 锻压技术. 2019(08)
[7]基于多层感知器的流量分类方法研究[J]. 郭丽,刘磊. 电子测量与仪器学报. 2019(07)
[8]基于改进CNN的局部相似性预测推荐模型[J]. 吴国栋,宋福根,涂立静,史明哲. 计算机工程与科学. 2019(06)
[9]基于异步优势执行器评价器学习的自适应PID控制设计[J]. 孙歧峰,任辉,段友祥. 信息与控制. 2019(03)
[10]基于广义回归神经网络的微生物降解效应对助燃剂检测的影响[J]. 方强,刘玲. 色谱. 2019(06)
博士论文
[1]基于多样化内容数据的个性化推荐系统[D]. 练建勋.中国科学技术大学 2018
硕士论文
[1]基于Spark平台的推荐系统的研究与实现[D]. 王水德.厦门大学 2017
本文编号:3350264
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3350264.html
最近更新
教材专著