知识图谱在图书馆推荐系统中的应用研究
发布时间:2021-09-23 03:06
近几年随着数字图书馆的高速发展,其数字资源馆藏已实现了海量增长,读者对资源的需求越来越个性化,这些因素推动着图书馆推荐系统应用的普及和深化。知识图谱技术是现今图书馆学的研究热点,据此,对基于知识图谱的图书馆推荐系统进行了研究,并将其与传统的基于ALS的协同过滤算法进行比较。结果显示,基于知识图谱的MKR推荐算法可以取得较好的图书推荐效果,能够助力今后个性化图书馆推荐系统的建设。
【文章来源】:自动化应用. 2020,(08)
【文章页数】:4 页
【部分图文】:
MKR的模型框架
因为图书所具有的物品特征和图谱实体之间可能存有属性的重合,所以推荐算法模型和知识图谱词嵌入模型KGM之间并非相互独立。通过在低层将左右两个模型桥接起来。将图书评分数据集中的图书向量与知识图谱中的图书向量特征融合起来,再分别放回各自的模型中,进行监督训练。该交换区域被称为交叉特征共享单元。由于推荐任务中的图书向量与知识图谱中的实体向量,本质上是对同一个对象的不同描述,它们之间通过信息交叉共享可以让双方都获得来自对方的补充信息,从而改善自身信息稀疏性的不足[4],其结构如图2所示。推荐系统通过对读者行为数据(包括用户信息、操作记录、评分记录等)的挖掘找出读者的兴趣偏好特性,基于不同的偏好为读者推荐资源。一般来说推荐系统的实现包括下面几个阶段:首先构建用户行为信息数据集与图书数据集,将用户和图书作为推荐算法模型的输入;然后将图书评分数据集中的图书向量与知识图谱中的图书向量特征融合起来,交替进行推荐算法模型与知识图谱嵌入模型的独立训练,确定最优参数(如图3所示),并通过使用内积的方式,计算用户向量和图书向量的相似度,最后将用户向量和图书向量连接起来,再通过全连接层处理计算出用户对该图书的喜好分值,取分值最大的前N条图书信息推荐给读者。
准确率(Precision)和召回率(Recall)作为个性化推荐系统的两个评测指标,可以用来衡量推荐结果的质量。平均精度均值mAP(mean Average Precision)能够反映全局性能,参考图4,其中两条曲线(实线与虚线)分别对应了两个推荐系统的准确率-召回率曲线。图4显示,两个不同推荐系统的性能曲线会有部分交集产生,但是以虚线表示的系统的性能在大部分情况下都要远好于实线表示的系统,一个系统的性能如果较好,那么其曲线应当尽可能地显示在上方。理想情况下的推荐系统,其包含的面积应当是1,而所有系统包含的面积都应当大于0,平均精度均值mAP的规范定义如下:
【参考文献】:
期刊论文
[1]改进的基于内容的协同过滤电影推荐算法[J]. 范志强,赵文涛. 信息与电脑(理论版). 2019(13)
[2]面向军事信息服务的智能推荐技术[J]. 王中伟,裘杭萍,孙毅,寇大磊. 指挥控制与仿真. 2019(04)
[3]数据挖掘技术下的个性化智能推荐系统设计[J]. 王炎. 微型电脑应用. 2019(02)
[4]互联网+时代下图书馆的发展与挑战探讨[J]. 田蕊. 科技风. 2019(02)
本文编号:3404906
【文章来源】:自动化应用. 2020,(08)
【文章页数】:4 页
【部分图文】:
MKR的模型框架
因为图书所具有的物品特征和图谱实体之间可能存有属性的重合,所以推荐算法模型和知识图谱词嵌入模型KGM之间并非相互独立。通过在低层将左右两个模型桥接起来。将图书评分数据集中的图书向量与知识图谱中的图书向量特征融合起来,再分别放回各自的模型中,进行监督训练。该交换区域被称为交叉特征共享单元。由于推荐任务中的图书向量与知识图谱中的实体向量,本质上是对同一个对象的不同描述,它们之间通过信息交叉共享可以让双方都获得来自对方的补充信息,从而改善自身信息稀疏性的不足[4],其结构如图2所示。推荐系统通过对读者行为数据(包括用户信息、操作记录、评分记录等)的挖掘找出读者的兴趣偏好特性,基于不同的偏好为读者推荐资源。一般来说推荐系统的实现包括下面几个阶段:首先构建用户行为信息数据集与图书数据集,将用户和图书作为推荐算法模型的输入;然后将图书评分数据集中的图书向量与知识图谱中的图书向量特征融合起来,交替进行推荐算法模型与知识图谱嵌入模型的独立训练,确定最优参数(如图3所示),并通过使用内积的方式,计算用户向量和图书向量的相似度,最后将用户向量和图书向量连接起来,再通过全连接层处理计算出用户对该图书的喜好分值,取分值最大的前N条图书信息推荐给读者。
准确率(Precision)和召回率(Recall)作为个性化推荐系统的两个评测指标,可以用来衡量推荐结果的质量。平均精度均值mAP(mean Average Precision)能够反映全局性能,参考图4,其中两条曲线(实线与虚线)分别对应了两个推荐系统的准确率-召回率曲线。图4显示,两个不同推荐系统的性能曲线会有部分交集产生,但是以虚线表示的系统的性能在大部分情况下都要远好于实线表示的系统,一个系统的性能如果较好,那么其曲线应当尽可能地显示在上方。理想情况下的推荐系统,其包含的面积应当是1,而所有系统包含的面积都应当大于0,平均精度均值mAP的规范定义如下:
【参考文献】:
期刊论文
[1]改进的基于内容的协同过滤电影推荐算法[J]. 范志强,赵文涛. 信息与电脑(理论版). 2019(13)
[2]面向军事信息服务的智能推荐技术[J]. 王中伟,裘杭萍,孙毅,寇大磊. 指挥控制与仿真. 2019(04)
[3]数据挖掘技术下的个性化智能推荐系统设计[J]. 王炎. 微型电脑应用. 2019(02)
[4]互联网+时代下图书馆的发展与挑战探讨[J]. 田蕊. 科技风. 2019(02)
本文编号:3404906
本文链接:https://www.wllwen.com/tushudanganlunwen/3404906.html