基于用户信任关系的推荐算法研究
发布时间:2021-01-09 03:55
传统的协同过滤推荐算法使用用户的历史数据进行推荐,容易面临数据缺失和稀疏等问题。基于模型的协同过滤算法大大缓解了这些问题,矩阵分解协同过滤算法就是其中之一,同时,结合其他数据例入用户社交信息来解决数据缺失问题也被证实有着较好的改善效果。本文从结合社交信任的矩阵分解协同过滤算法出发,研究了使用用户信任关系缓解稀疏数据问题中的用户冷启动子问题。TrustSVD算法作为基于信任的矩阵分解推荐算法,其将信任信息通过重表示与共享矩阵两种方式融合在算法模型中,使其结果较其他同类算法更为精确。但算法仅考虑了用户间的直接信任关系,且未考虑信任的动态传播特性。本文选择从对信任传播的研究出发,通过加入用户之间的弱连接信任关系丰富了稀疏的信任数据集,并基于信任的度量对用户进行了更加深入的挖掘。本文完成了以下两部分工作:(1)基于弱连接信任提出改进的W-TrustSVD算法:通过在用户直接信任关系集上加入信任的间接传播考察,构建用户弱连接信任定义,丰富用户信任集的同时,合理地构建信任的综合度量方法,并按综合信任度量以比例筛选构建出的最终用户弱连接信任集合。通过加入弱连接信任集合对W-TrustSVD算法的进行...
【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
推荐架构模块示意图
兰州大学硕士学位论文基于用户信任关系的推荐算法研究8分主要包括:历史用户数据层、离线推荐引擎层、过滤线上推荐层和用户行为反馈层。具体的系统设计根据每部分不同的实现原理,采用不同的方式将上述核心部分循环或串联或混合式地组合起来。历史用户数据层通常包含商业平台所收集到的历史数据,如用户的点击、浏览、关注等,以及平台的商品标签信息等,在一些系统中该层还包括在获取数据后会对数据进行初步特征提取处理等;离线推荐引擎层是使推荐差异化的核心所在,决定着整个推荐系统的理论准确度,主要为使用进行了特征工程的数据,经过推荐算法模型计算得出初步推荐的物品集,在这一部分选择的算法不同对于特征数据的要求也有所不同;过滤线上推荐层使用经过离线推荐得出的初步推荐结果集,再对其进行筛癣排序等操作以最终呈现给用户,这一部分也常常包括将多种离线推荐引擎结果进行融合得到最终推荐集的过程;用户行为反馈层主要在最终推荐中起到循环改进的效果,通过用户对最终推荐的及时行为调整线上推荐的策略,以达到更精准的个性化推荐效果。图2-2为推荐系统流程示意图,图2-3为推荐系统详细示意图。图2-2推荐系统流程示意图
兰州大学硕士学位论文基于用户信任关系的推荐算法研究9图2-3推荐系统详细示意图在线推荐策略则主要针对离线推荐结果进行加工并展示给用户,根据user-base和item-base产生的推荐结果通过合并去重、过滤、排序和补足等方式,有时还会将“用户反辣放入这部分对结果进行再次计算并调整,最后得到最终推荐结果。在线策略中的过滤、排序和补足等步骤所选择的算法由于对即时性的要求往往在时间复杂度上追求最低,其中补足指在离线推荐所生成的结果太少无法满足推荐页面需求量时采用默认值填充的做法。完成离线和在线两部分计算后,最终结果将出现在用户交互的UI界面中。最终部分有时会采取推荐解释以对推荐原理进行解释,如“来自好友都喜欢的”、“来自购买过/浏览过相似商品的用户”等等,有研究显示进行推荐解释可达到更好的推荐效果。2.1.2推荐系统数据组成推荐系统的数据是根本,其质量决定着后续推荐的效果。电子商务的推荐数据来源可总结为线上和本地数据两部分,线上部分包括点击、浏览、加购等类似的历史数据,本地数据则记录用户的一些边际信息和物品的各种属性档案,这两个部分的数据都会或直接或经过加工处理后存储到数据库中。所有的原始数据在经过清洗后,将会通过特征工程最终被应用于核心推荐算法中,特征工程会提取出算法所需的特征数据如物品的类目属性、用户的属性及用户物品关联规则等,处理后的特征作为核心数据储存于系统中。图2-4为推荐系统综合架构图解。
本文编号:2965922
【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
推荐架构模块示意图
兰州大学硕士学位论文基于用户信任关系的推荐算法研究8分主要包括:历史用户数据层、离线推荐引擎层、过滤线上推荐层和用户行为反馈层。具体的系统设计根据每部分不同的实现原理,采用不同的方式将上述核心部分循环或串联或混合式地组合起来。历史用户数据层通常包含商业平台所收集到的历史数据,如用户的点击、浏览、关注等,以及平台的商品标签信息等,在一些系统中该层还包括在获取数据后会对数据进行初步特征提取处理等;离线推荐引擎层是使推荐差异化的核心所在,决定着整个推荐系统的理论准确度,主要为使用进行了特征工程的数据,经过推荐算法模型计算得出初步推荐的物品集,在这一部分选择的算法不同对于特征数据的要求也有所不同;过滤线上推荐层使用经过离线推荐得出的初步推荐结果集,再对其进行筛癣排序等操作以最终呈现给用户,这一部分也常常包括将多种离线推荐引擎结果进行融合得到最终推荐集的过程;用户行为反馈层主要在最终推荐中起到循环改进的效果,通过用户对最终推荐的及时行为调整线上推荐的策略,以达到更精准的个性化推荐效果。图2-2为推荐系统流程示意图,图2-3为推荐系统详细示意图。图2-2推荐系统流程示意图
兰州大学硕士学位论文基于用户信任关系的推荐算法研究9图2-3推荐系统详细示意图在线推荐策略则主要针对离线推荐结果进行加工并展示给用户,根据user-base和item-base产生的推荐结果通过合并去重、过滤、排序和补足等方式,有时还会将“用户反辣放入这部分对结果进行再次计算并调整,最后得到最终推荐结果。在线策略中的过滤、排序和补足等步骤所选择的算法由于对即时性的要求往往在时间复杂度上追求最低,其中补足指在离线推荐所生成的结果太少无法满足推荐页面需求量时采用默认值填充的做法。完成离线和在线两部分计算后,最终结果将出现在用户交互的UI界面中。最终部分有时会采取推荐解释以对推荐原理进行解释,如“来自好友都喜欢的”、“来自购买过/浏览过相似商品的用户”等等,有研究显示进行推荐解释可达到更好的推荐效果。2.1.2推荐系统数据组成推荐系统的数据是根本,其质量决定着后续推荐的效果。电子商务的推荐数据来源可总结为线上和本地数据两部分,线上部分包括点击、浏览、加购等类似的历史数据,本地数据则记录用户的一些边际信息和物品的各种属性档案,这两个部分的数据都会或直接或经过加工处理后存储到数据库中。所有的原始数据在经过清洗后,将会通过特征工程最终被应用于核心推荐算法中,特征工程会提取出算法所需的特征数据如物品的类目属性、用户的属性及用户物品关联规则等,处理后的特征作为核心数据储存于系统中。图2-4为推荐系统综合架构图解。
本文编号:2965922
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2965922.html
最近更新
教材专著