当前位置:主页 > 科技论文 > 搜索引擎论文 >

融合主题模型和词嵌入的查询优化方法研究

发布时间:2021-02-14 01:25
  搜索引擎技术的发展与应用改变了人们获取信息的方式。但是在信息检索中,由于用户的查询简短、查询意图不明确等原因,常使系统返回的文档不符合用户的搜索意图。为了提升检索性能,搜索引擎普遍采用查询优化技术,包括查询扩展和查询推荐两方面。传统的优化方法中,伪相关反馈方法是一种有效的方案,但其中的主题偏移问题会给优化效果带来负面的影响,降低检索性能。对于查询扩展,在由伪相关反馈文档获取扩展词后,常将其简单地拼接到原始查询中,这种方式没有对查询词和扩展词之间的相关度进行度量,会对返回文档的排序造成影响。对于查询推荐,由于搜索日趋专业化,如何从伪相关反馈文档中挖掘术语词进行推荐以及如何获取查询词和推荐词之间的语义关系成为重要的研究问题。本文针对以上问题进行了以下三个方面的研究:1.提出主题推断策略去解决伪相关反馈方法中的主题偏移问题。首先使用基于语言模型的打分策略获取反馈文档,并用LDA主题模型对其进行建模;然后用基于吉布斯采样和词嵌入的方法对查询语句的主题进行推断,由此确定相关主题进而改进了基于主题模型的候选词获取方法。实验表明,词嵌入方法从语义的角度出发,在多个方面对查询进行了描述,体现了更多的语... 

【文章来源】:北方工业大学北京市

【文章页数】:71 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 引言
    1.1 研究背景和意义
    1.2 研究内容
    1.3 主要工作及组织结构
第二章 相关研究与技术概述
    2.1 查询扩展
        2.1.1 查询扩展概述
        2.1.2 查询扩展技术方法
        2.1.3 查询扩展研究现状
    2.2 查询推荐
        2.2.1 查询推荐概述
        2.2.2 查询推荐技术方法
        2.2.3 查询推荐研究现状
    2.3 本章总结
第三章 伪相关反馈方法研究
    3.1 交互式相关反馈与伪相关反馈
    3.2 基于主题模型的相关反馈
    3.3 主题推断策略
        3.3.1 吉布斯采样
        3.3.2 GBS主题推断策略
        3.3.3 TopK主题推断策略
        3.3.4 语言模型
    3.4 实验
        3.4.1 实验数据
        3.4.2 实验设置和结果
    3.5 本章总结
第四章 融合主题模型和词嵌入的查询扩展研究
    4.1 查询扩展流程框架
    4.2 候选扩展词的获取
        4.2.1 查询主题的选择
        4.2.2 扩展词的选取
    4.3 候选扩展词的特征
        4.3.1 语义特征
        4.3.2 统计特征
        4.3.3 特征排序
    4.4 实验
        4.4.1 实验数据
        4.4.2 实验设置
        4.4.3 对比实验结果
        4.4.4 文档数和主题数对结果的影响实验
    4.5 本章总结
第五章 融合主题模型和词嵌入的查询推荐研究
    5.1 查询推荐流程框架
    5.2 候选推荐词的获取
    5.3 语义关系识别
        5.3.1 有监督关系识别
        5.3.2 无监督关系识别
    5.4 实验
        5.4.1 实验数据和评价指标
        5.4.2 实验设置
        5.4.3 实验结果和分析
    5.5 本章总结
第六章 演示系统的设计和展示
    6.1 实验过程
        6.1.1 文档预处理
        6.1.2 主题推断实现
        6.1.3 扩展词权重的计算
        6.1.4 推荐词关系的获取
    6.2 本章总结
第七章 总结和展望
    7.1 主要结论
    7.2 研究展望
参考文献
附录A
在学期间的研究成果
致谢


【参考文献】:
期刊论文
[1]Web数据库top-k多样性关键字查询推荐方法[J]. 孟祥福,毕崇春,张霄雁,唐晓亮,唐延欢.  计算机研究与发展. 2017(07)
[2]基于事件元素无向图的查询扩展方法[J]. 叶雷,高盛祥,余正涛,秦广顺,洪旭东.  中文信息学报. 2017(01)
[3]基于词汇时间分布的微博查询扩展[J]. 韩中元,杨沐昀,孔蕾蕾,齐浩亮,李生.  计算机学报. 2016(10)
[4]一种基于排序学习方法的查询扩展技术[J]. 徐博,林鸿飞,林原,王健.  中文信息学报. 2015(03)
[5]基于用户意图识别的查询推荐研究[J]. 罗成,刘奕群,张敏,马少平,茹立云,张阔.  中文信息学报. 2014(01)
[6]基于吸收态随机行走的两阶段效用性查询推荐方法[J]. 朱小飞,郭嘉丰,程学旗,兰艳艳.  计算机研究与发展. 2013(12)
[7]基于迭代方法的多层Markov网络信息检索模型[J]. 洪欢,王明文,万剑怡,廖亚男.  中文信息学报. 2013(05)
[8]基于整数线性规划的查询扩展[J]. 吴龑,张奇,黄萱菁.  计算机研究与发展. 2013(08)
[9]基于查询意图的长尾查询推荐[J]. 白露,郭嘉丰,曹雷,程学旗.  计算机学报. 2013(03)
[10]给互联网建立索引:基于词关系网络的智能查询推荐[J]. 李亚楠,王斌,李锦涛,李鹏.  软件学报. 2011(08)



本文编号:3032893

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3032893.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户16825***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com