人机混合的知识图谱主动搜索
发布时间:2021-01-20 02:07
在知识图谱进行有效的搜索可以为智能问答、语义检索等智能应用提供有效支撑.然而,当用户不能给出明确的查询意图时,一个搜索系统要如何精准捕获用户的兴趣并找到对应的查询目标是项难题.人机混合的主动搜索为缓解用户和机器之间的理解鸿沟提供了桥梁.人机混合的主动搜索核心在于让机器主动地向用户提出相关的问题,从用户的反馈中获取信息,再基于这些信息对检索候选项进行搜索,形成人机混合的回路,最终精准定位用户意图并返回查询结果.在知识图谱表示学习技术的基础上,将知识图谱的搜索任务建模成向量空间中人机混合的主动搜索任务.具体来说,首先将知识图谱和用户的兴趣偏好嵌入到同一低维向量空间.然后,机器主动向用户提问,通过让用户对具体实体进行打分的方式获取相应的反馈信息,进而更新用户偏好在向量空间中的定位.设计了一种评价方式,基于偏好点与其他实体之间的欧氏距离来度量用户对某个实体的兴趣,最终在人机多轮交互后找到对应的目标实体返回给用户.在实验部分,对知识图谱的嵌入过程和主动搜索的过程分别进行了实验,实验结果显示,所提出的方法具有一定的效果.
【文章来源】:计算机研究与发展. 2020,57(12)北大核心
【文章页数】:13 页
【部分图文】:
人机混合的知识图谱主动搜索实例
在现实情况(即测试环境)下,模型在定位用户偏好嵌入之前,只能向用户提出有限次问题,否则由于用户解答某个问题所需要的时间以秒为单位,该提问的过程会耗费用户过多的时间.但在训练的过程中并没有时间的限制,因此我们设计了一种模拟评分模式,该模式在训练时能够基于用户的目标实体嵌入、起点实体嵌入以及问题实体嵌入三者之间的距离关系来模拟用户给出的分数.以图1为例,在训练时对每一个邻居进行考量,邻居如“海伦娜·卡特”和“学院奖”离目标较遥远,而邻居如“约翰尼·德普”“《剪刀手爱德华》”则离目标较近或者就是目标本身.对于前者,用户应当不感兴趣;对于后者,用户应当感兴趣.而即便对2个实体都感兴趣,其兴趣程度也不尽相同,如,当用户的目标恰为“《剪刀手爱德华》”时,对实体“约翰尼·德普”的兴趣程度显然会低于这部电影.因此在设计的评分模式中,我们假设用户对某实体的兴趣程度随着该实体与目标实体距离的减小而提高,如图3所示,黑色点表示起点实体,绿色点表示目标实体.以目标实体为中心,目标实体与起点实体之间的距离的0.5,1,2倍为半径,将空间划分为4个不同的区域,处于这四个区域的其他实体分别对应该区域的分数(-2,-1,1,2).基于该评分模式,我们设置了一种训练机制,在该机制的作用下,训练过程中,每一个邻居实体都会被考虑到,训练过程也会更为充分.详细的说明与相关数学式为:
主动搜素实验结果展示
【参考文献】:
期刊论文
[1]知识图谱构建技术综述[J]. 刘峤,李杨,段宏,刘瑶,秦志光. 计算机研究与发展. 2016(03)
[2]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
本文编号:2988148
【文章来源】:计算机研究与发展. 2020,57(12)北大核心
【文章页数】:13 页
【部分图文】:
人机混合的知识图谱主动搜索实例
在现实情况(即测试环境)下,模型在定位用户偏好嵌入之前,只能向用户提出有限次问题,否则由于用户解答某个问题所需要的时间以秒为单位,该提问的过程会耗费用户过多的时间.但在训练的过程中并没有时间的限制,因此我们设计了一种模拟评分模式,该模式在训练时能够基于用户的目标实体嵌入、起点实体嵌入以及问题实体嵌入三者之间的距离关系来模拟用户给出的分数.以图1为例,在训练时对每一个邻居进行考量,邻居如“海伦娜·卡特”和“学院奖”离目标较遥远,而邻居如“约翰尼·德普”“《剪刀手爱德华》”则离目标较近或者就是目标本身.对于前者,用户应当不感兴趣;对于后者,用户应当感兴趣.而即便对2个实体都感兴趣,其兴趣程度也不尽相同,如,当用户的目标恰为“《剪刀手爱德华》”时,对实体“约翰尼·德普”的兴趣程度显然会低于这部电影.因此在设计的评分模式中,我们假设用户对某实体的兴趣程度随着该实体与目标实体距离的减小而提高,如图3所示,黑色点表示起点实体,绿色点表示目标实体.以目标实体为中心,目标实体与起点实体之间的距离的0.5,1,2倍为半径,将空间划分为4个不同的区域,处于这四个区域的其他实体分别对应该区域的分数(-2,-1,1,2).基于该评分模式,我们设置了一种训练机制,在该机制的作用下,训练过程中,每一个邻居实体都会被考虑到,训练过程也会更为充分.详细的说明与相关数学式为:
主动搜素实验结果展示
【参考文献】:
期刊论文
[1]知识图谱构建技术综述[J]. 刘峤,李杨,段宏,刘瑶,秦志光. 计算机研究与发展. 2016(03)
[2]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
本文编号:2988148
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2988148.html