基于隐性反馈和时序信息的矩阵分解推荐算法研究
发布时间:2021-06-10 18:51
随着互联网的发展,电子商务网站为用户提供便捷服务的同时,也带来了数据海量、种类繁多、同质化等问题,阻碍用户找到自己需要的商品,这种现象被称为信息过载。推荐系统应运而生,它通过分析历史数据获取用户尚未购买但是感兴趣的商品,实现“主动”推荐。用户的历史数据可以分为两类:显性反馈和隐性反馈。显性反馈是一类能够直观体现用户兴趣程度的各个指标,例如评分;隐性反馈是隐藏在用户行为背后的规律性信息,例如用户的支付记录、用户的观看记录、商品的流行度等,虽然不能直观地体现用户的喜好,但是可以反映用户的关注点,尤其以用户行为产生的时序信息在时间轴上的变化更能反映用户关注点的波动。传统的推荐系统技术主要通过分析显性反馈生成符合用户需求的商品,但由于显性反馈的稀疏性和不易获取性,不能全面地展现用户的兴趣喜好,而隐性反馈由于数据量丰富逐步成为研究的热点。但基于隐性反馈的推荐系统仍面临三个方面的问题:第一,负样本的匮乏使得隐性反馈难以利用;第二,由于用户兴趣波动,导致隐性反馈具有时间上的动态性,静态分析隐性反馈不利于发掘数据的变化规律,影响推荐的准确度;第三,隐性反馈数据稠密,应用于显性反馈的优化方法并不适用于隐...
【文章来源】:山东师范大学山东省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
文章结构图
山东师范大学硕士学位论文11行度和时间之间具有强相关关系。其中,X轴表示时间的跨度,Y轴表示商品的平均流行度。商品的平均流行度在前900天随时间的增加而快速升高,并且在第一千天达到峰值。这种现象表明,商品在前一千天处于热门阶段,并且受关注程度的增长速率较快,产生这种现象的原因是多样的。例如,随着受众的增加,商品的热度随即呈指数增长。但是,在一千天之后,商品的平均流行度大幅降低,并且随时间的增加而缓慢的递减。这种现象表明,商品的热度开始消退,逐步淡出用户的视野。整体而言,商品的平均流行度在商品的发行早期呈热门状态,而在今后较长的时间段内处于冷门阶段,且热度持续降低。图3-1平均流行度随时间的变化规律3.1.2单个商品的流行度随时间的变化规律下一步,本文分析单个商品的流行度随时间的变化规律。在本章实验中随机的选取商品作为分析对象。如图3-2所示,其中X轴表示时间跨度,Y轴表示单个商品的流行度。流行度分布以第一千天作为分界点。第一阶段为前一千天,第二阶段为第一千天之后。在第一阶段中,商品的流行度在前五百天缓慢增长;但是在五百天之后,商品的流行度开始大幅度增加,增长速率大,并且在第一千天时,流行度达到峰值。引起这种现象的原因是多样的,例如,由于受众的增加导致交互用户变多,进而反作用于流行度,促进流行度的增加,最终形成一个循环。由此可见,商品在前一千天处于热门阶段。然而,商品的流行度达到峰值之后,在短暂的时间内大幅度下降。在一千天之后,剩余的时间跨度被分为两个时间片段。第一个时间片段的跨度大约为1700天,范围为第1000天到第2700天;第二个时间片段的跨度大约为3300天,范围为第2700天到第6000天。在第一个时间片段内,
山东师范大学硕士学位论文12商品的流行度波动频繁,但始终保持在数值500以下,并在第一时间片段和第二时间片段的交界处发生陡降;在第二个时间片段,商品的流行度在第2700天至第3000天之间虽然存在一个轻微的增长,但是在第3000天之后,流行度缓慢下降。尽管在两个时间片段内流行度呈波动状态,但是总体而言,在由第一时间片段和第二时间片段构成的第二阶段内,商品的流行度呈下降趋势。图3-2单个商品的流行度随时间的变化规律3.2流行度与时间的关系基于上述分析,本文可以得到如下结论:1.商品的流行度与时间之间存在强相关关系。通过分析可以发现,商品的流行度是动态的,并且随时间的变化而变化。通常,商品的流行度可以根据时间划分为两个阶段,即热门阶段和冷门阶段。在热门阶段,商品的流行度整体呈上升趋势,随时间的延长而增加。但在不同的时间点,其增加速率是不同的;在冷门阶段,商品的流行度整体呈下降趋势,随时间的增加而减少,并且减少速率较为平缓。2.负样本的分布随着时间的变化而转变。如果一个商品是热门商品,那么该商品就可以出现在网站首页被推荐给用户。如果一个出现在网站首页的热门商品没有用户与其产生交互动作,例如,收藏、点击、购买、分享给好友等,这类缺少交互行为的热门商品可以被视作负样本[53]。同时,由于流行度与商品的交互行为密切相关,并且流行度的分布与时间变化有关,因此,负样本的分布受时间的影响,即负样本的分布与商品的流行度随时间的变化规律有关联。根据商品流行度的数值从大量的缺失数据中区分负样本和未知数据时,
【参考文献】:
期刊论文
[1]面向隐式反馈的推荐系统研究现状与趋势[J]. 陆艺,曹健. 计算机科学. 2016(04)
[2]基于时序行为的协同过滤推荐算法[J]. 孙光福,吴乐,刘淇,朱琛,陈恩红. 软件学报. 2013(11)
本文编号:3222932
【文章来源】:山东师范大学山东省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
文章结构图
山东师范大学硕士学位论文11行度和时间之间具有强相关关系。其中,X轴表示时间的跨度,Y轴表示商品的平均流行度。商品的平均流行度在前900天随时间的增加而快速升高,并且在第一千天达到峰值。这种现象表明,商品在前一千天处于热门阶段,并且受关注程度的增长速率较快,产生这种现象的原因是多样的。例如,随着受众的增加,商品的热度随即呈指数增长。但是,在一千天之后,商品的平均流行度大幅降低,并且随时间的增加而缓慢的递减。这种现象表明,商品的热度开始消退,逐步淡出用户的视野。整体而言,商品的平均流行度在商品的发行早期呈热门状态,而在今后较长的时间段内处于冷门阶段,且热度持续降低。图3-1平均流行度随时间的变化规律3.1.2单个商品的流行度随时间的变化规律下一步,本文分析单个商品的流行度随时间的变化规律。在本章实验中随机的选取商品作为分析对象。如图3-2所示,其中X轴表示时间跨度,Y轴表示单个商品的流行度。流行度分布以第一千天作为分界点。第一阶段为前一千天,第二阶段为第一千天之后。在第一阶段中,商品的流行度在前五百天缓慢增长;但是在五百天之后,商品的流行度开始大幅度增加,增长速率大,并且在第一千天时,流行度达到峰值。引起这种现象的原因是多样的,例如,由于受众的增加导致交互用户变多,进而反作用于流行度,促进流行度的增加,最终形成一个循环。由此可见,商品在前一千天处于热门阶段。然而,商品的流行度达到峰值之后,在短暂的时间内大幅度下降。在一千天之后,剩余的时间跨度被分为两个时间片段。第一个时间片段的跨度大约为1700天,范围为第1000天到第2700天;第二个时间片段的跨度大约为3300天,范围为第2700天到第6000天。在第一个时间片段内,
山东师范大学硕士学位论文12商品的流行度波动频繁,但始终保持在数值500以下,并在第一时间片段和第二时间片段的交界处发生陡降;在第二个时间片段,商品的流行度在第2700天至第3000天之间虽然存在一个轻微的增长,但是在第3000天之后,流行度缓慢下降。尽管在两个时间片段内流行度呈波动状态,但是总体而言,在由第一时间片段和第二时间片段构成的第二阶段内,商品的流行度呈下降趋势。图3-2单个商品的流行度随时间的变化规律3.2流行度与时间的关系基于上述分析,本文可以得到如下结论:1.商品的流行度与时间之间存在强相关关系。通过分析可以发现,商品的流行度是动态的,并且随时间的变化而变化。通常,商品的流行度可以根据时间划分为两个阶段,即热门阶段和冷门阶段。在热门阶段,商品的流行度整体呈上升趋势,随时间的延长而增加。但在不同的时间点,其增加速率是不同的;在冷门阶段,商品的流行度整体呈下降趋势,随时间的增加而减少,并且减少速率较为平缓。2.负样本的分布随着时间的变化而转变。如果一个商品是热门商品,那么该商品就可以出现在网站首页被推荐给用户。如果一个出现在网站首页的热门商品没有用户与其产生交互动作,例如,收藏、点击、购买、分享给好友等,这类缺少交互行为的热门商品可以被视作负样本[53]。同时,由于流行度与商品的交互行为密切相关,并且流行度的分布与时间变化有关,因此,负样本的分布受时间的影响,即负样本的分布与商品的流行度随时间的变化规律有关联。根据商品流行度的数值从大量的缺失数据中区分负样本和未知数据时,
【参考文献】:
期刊论文
[1]面向隐式反馈的推荐系统研究现状与趋势[J]. 陆艺,曹健. 计算机科学. 2016(04)
[2]基于时序行为的协同过滤推荐算法[J]. 孙光福,吴乐,刘淇,朱琛,陈恩红. 软件学报. 2013(11)
本文编号:3222932
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3222932.html
最近更新
教材专著