当前位置:主页 > 科技论文 > 搜索引擎论文 >

面向实体搜索的语义查询扩展方法研究

发布时间:2020-03-19 08:44
【摘要】:大数据时代社交网络、移动互联网、物联网等领域每天都会产生海量数据,数据的爆炸式增长导致了信息过载,同时也改变了用户的信息需求,从原来的文本信息过渡到现在的实体信息,相应地产生了实体搜索。不同于文档搜索,实体搜索旨在从多源异构数据中找出特定实体对象,对搜索质量的要求更加严格。传统的查询扩展方法能够提高文档搜索质量,但存在扩展项来源有限、扩展效率低和查询漂移问题,影响了查询扩展性能,不完全适用于实体搜索。针对上述问题,提出了一种面向实体搜索的语义查询扩展方法。在索引阶段,该方法通过构建分层的语义索引来存储异构信息并支持关联项的快速获取;在查询扩展阶段,基于建立的语义索引采用不同的扩展项生成方法和选取策略来获取结构化和非结构化扩展项,然后利用扩展项之间的关联性进行扩展项优化;最后,针对不同类型的扩展查询结果使用组合概率模型进行合并排序得到最终结果。该方法结合扩展项的特征并充分利用语义索引的高效性和不同查询扩展方法的优点,在保证查询扩展效率的同时提高了查询扩展效果,并且有效避免了查询漂移问题。为了验证语义查询扩展方法的性能,在ClueWeb09 Category B采样得到的数据集上进行了性能测试。实验结果表明提出的语义查询扩展方法在保证查询效率的前提下能够有效提高实体搜索的性能并缓解查询漂移问题。
【图文】:

架构图,搜索系统,实体,架构


科 技 大 学 硕 士 学 位 贪心算法并利用可扩展的查询语言 CQL,实现索效率;Broccoli[12]融合文档和结构化知识库中式向用户提供了一个异构数据源中实体信询过程中利用基于位置特征的排序模型移除AGA[15]将结构化查询转化为不同的有向图,通中的实体搜索;ECDF[16]基于元特征的迁移学习。用户或应用

索引结构,上下文


1.2 国内外研究现状围绕不同数据源中实体信息的高效存储与利用以及如何更好地理解查询意图并快速、准确地从实体信息中找到用户感兴趣的相关信息,国内外开展了许多相关的研究工作。下面从实体搜索和查询扩展两个方面来详细介绍面向实体搜索的查询扩展方法研究现状。1.2.1 实体搜索的研究现状针对实体信息的特点,,目前实体搜索的研究内容主要集中在索引结构和排序方法上,索引结构的相关工作有 DoCQS 中的上下文索引[11](Contextual Index)、双倒排索引[2](Dual Inverted Index)和 Broccoli 中的联合索引[20](Joint Index),排序方法的相关工作包括生成模型[21](GenerativeModel)、学习排序模型[22](LearntoRank)、基于位置特征的累积模型[23](Cumulative Model)以及基于图特征的语言模型[24](Language Model)。K1, K2 docId, pos1, pos2... ...上下文中的共现项组合 上下文中的邻近项映射docId, pos1K2, pos2K3, pos3...K1 K ......
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1

【参考文献】

相关期刊论文 前2条

1 李爱明;;基于本体和用户查询意图的查询扩展方法研究[J];情报科学;2015年05期

2 刘玉文;;基于十字链表的Apriori算法的研究与改进[J];计算机应用与软件;2012年05期



本文编号:2589998

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2589998.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5fa63***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com