当前位置:主页 > 科技论文 > 搜索引擎论文 >

搜索结果多样化研究综述

发布时间:2022-10-09 15:25
  基于传统信息检索技术的搜索引擎一般按照用户提交的查询获得一系列搜索结果,经过相关性排序之后返回给用户.相关研究表明,用户提交给搜索引擎的查询通常是短查询,且经常具有歧义性和宽泛性.另外,不同的用户在使用同一个查询词时,其查询需求也往往是不同的.此时若搜索引擎只进行相关性排序,则会面临搜索结果冗余性过大、无法有效覆盖用户意图的问题,对用户体验产生负面影响.为了满足用户需求,现有的搜索引擎在搜索排序过程中必须有效应对查询歧义性问题.搜索结果多样化是解决这个问题的方法之一,其目标是尽量提升搜索结果的多样性,让搜索结果尽可能多地覆盖不同用户的查询意图,以确保至少有一个结果可以命中实际的用户需求.和传统的搜索排序模型仅考虑文档和查询的相关性不同,多样化排序模型还需要进一步考虑文档的新颖性或者结果集对不同用户意图的覆盖度.现有的多样化算法,根据是否显式地衡量查询包含潜在用户意图所对应的子话题,可以分为隐式多样化模型和显式多样化模型.隐式多样化模型通常只考虑文档之间的相似性,即认为一份结果文档集中的每一个结果文档,彼此之间的不相似度越高,多样化程度越高;而显式多样化模型则显式地考虑不同查询所对应的不... 

【文章页数】:23 页

【文章目录】:
1 引言
2 搜索结果多样化的定义
    (1)基于内容(Content-based)的定义
    (2)基于新颖性(Novelty-based)的定义
    (3)基于覆盖度(Coverage-based)的定义
3 搜索结果多样化算法
    3.1 隐式多样化排序方法
    3.2 显式多样化排序方法
        3.2.1 显式多样化排序的子话题抽取
        3.2.2 显式多样化排序模型
            3.2.2. 1 xQuAD模型
            3.2.2. 2 PM2模型
            3.2.2. 3 基于子话题多层级分类方法的HxQuAD和HPM2模型
            3.2.2. 4 针对短文本流的多样化
    3.3 基于监督式学习的多样化排序模型
        3.3.1 学习式排序模型概述
        3.3.2 关系排序模型(R-LTR)与PAMM模型
        3.3.3 使用神经张量网络(NTN)抽取新颖性特征
        3.3.4 基于注意力机制的显式多样化学习方法
        3.3.5 小结
    3.4 将强化学习应用到搜索结果多样化中
    3.5 搜索结果个性多样化
4 搜索结果多样化的主要评价指标
5 搜索结果多样化实验结果与分析
6 搜索结果多样化在实际部署的大型分布式系统中的性能评估
7 未来研究方向
Background



本文编号:3688887

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3688887.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e56ff***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com