基于潜在语义关系的伪相关反馈查询扩展技术研究
发布时间:2021-05-07 12:57
伪相关反馈与查询扩展作为信息检索领域的关键技术,能极大地提高信息检索系统的性能,一直以来深受国内外信息检索领域学者的重视。在伪相关反馈的过程中,对原始查询进行扩展是非常重要的一个环节。在选取扩展词项的时候,传统的伪相关反馈方法大都聚焦于评估候选扩展词项在伪相关文档中的词频重要性和显著性,往往会遗漏候选扩展词项与查询词项之间潜在语义关系。本文结合经典的伪相关反馈查询扩展方法,围绕候选扩展词项的语义捕获与表示,提出了若干个具有不同语义特征的伪相关反馈查询扩展方法。实验结果表明这些方法能够优化扩展词项的质量,提高信息检索的效果。主要的研究工作和创新点包含以下几个方面:(1)本文提出了一种基于词项超空间语义的伪相关反馈模型HRoc。该模型采用一种改进的超空间模拟语言算法度量查询词项与候选扩展词项之间的潜在语义关系,并在传统的Rocchio模型中融入这一语义关系完成查询扩展。在此基础上,本文为HRoc模型设计了三种不同的归一化策略。这些策略可以用来协调由不同特征生成的候选扩展词项的权重。最后,本文还引入了一个自适应函数来代替HRoc模型中的参数D,它可以根据文档长度自动选择窗口大小。在PMC20...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:109 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 研究意义
1.3 研究内容
1.4 本文的组织结构
第二章 伪相关反馈技术研究现状
2.1 信息检索与伪相关反馈发展简述
2.1.1 信息检索技术
2.1.2 相关反馈与查询扩展技术
2.1.3 伪相关反馈技术
2.2 伪相关反馈技术相关研究概述
2.2.1 基于向量空间模型的伪相关反馈技术
2.2.2 基于语言模型的伪相关反馈技术
2.2.3 基于位置信息的伪相关反馈技术
2.2.4 基于深度学习模型的伪相关反馈技术
2.2.5 基于其他方法的伪相关反馈技术
2.3 本章小结
第三章 基于词项超空间语义的伪相关反馈查询扩展研究
3.1 引言
3.2 语义空间
3.3 超空间模拟语言
3.4 Rocchio伪相关反馈框架
3.5 基于词项超空间语义的伪相关反馈
3.5.1 词项超空间语义权重
3.5.2 融入词项超空间语义的伪相关反馈模型
3.5.3 归一化方法
3.6 实验相关设置
3.6.1 实验数据集及评价标准
3.6.2 基线模型
3.6.3 参数设置
3.7 实验结果和讨论
3.7.1 与基线模型比较
3.7.2 与其他伪相关反馈模型比较
3.7.3 归一化函数的对比分析
3.7.4 动态自适应窗口值分析
3.7.5 实验结果与讨论
3.7.6 局限性
3.8 本章小结
第四章 基于核函数词项共现语义的伪相关反馈查询扩展研究
4.1 引言
4.2 基于核函数词项共现的伪相关反馈方法
4.2.1 传统的PRF模型框架
4.2.2 核函数词项共现语义权重
4.2.3 基于核函数的词项共现语义框架
4.3 实验设置
4.3.1 数据集和评价标准
4.3.2 基线模型和其他相关对比模型介绍
4.3.3 参数设置
4.4 实验设计、结果与分析
4.4.1 基准实验
4.4.2 与强基线模型比较
4.4.3 与重要的伪相关反馈模型比较
4.4.4 参数敏感性
4.4.5 分析和讨论
4.5 本章小结
第五章 基于BERT模型句子潜在语义的伪相关反馈查询扩展研究
5.1 引言
5.2 句子语义
5.2.1 句子向量
5.2.2 句子的向量表示
5.2.3 句子语义相似度计算—BERT模型
5.3 基于BERT模型句子语义相似度的伪相关反馈方法
5.3.1 基于BERT的句子语义特征
5.3.2 融入句子语义特征到Rocchio模型
5.4 实验设置和结果分析
5.4.1 实验设置
5.4.2 与强基线模型比较
5.4.3 与其他经典的模型比较
5.4.4 参数敏感性
5.5 本章小结
第六章 总结和展望
6.1 全文总结
6.2 未来工作
参考文献
研究成果及参与的科研项目
研究成果
已发表的科研论文
已投的科研论文
国家发明专利
软件著作权
参与的科研项目
致谢
【参考文献】:
期刊论文
[1]一种基于Hownet的词向量表示方法[J]. 陈洋,罗智勇. 北京大学学报(自然科学版). 2019(01)
[2]基于词语关系的词向量模型[J]. 蒋振超,李丽双,黄德根. 中文信息学报. 2017(03)
[3]相关反馈在信息检索中的研究综述[J]. 于莹莹,陈燕,张金松. 情报理论与实践. 2016(12)
[4]基于检索结果排序的伪相关反馈[J]. 闫蓉,高光来. 计算机应用. 2016(08)
[5]基于分类模型的查询扩展方法[J]. 李维银,石玉龙,陈杰,施重阳. 计算机科学. 2015(06)
[6]医学信息检索中一种基于概念的查询相关模型[J]. 李纲,毛进,芦昆. 情报学报. 2014 (03)
[7]双语主题跨语言伪相关反馈[J]. 王序文,王小捷,孙月萍. 北京邮电大学学报. 2013(04)
[8]基于Markov网络团的查询意图识别[J]. 蔡桂秀,王明文,揭安全,王晓庆. 江西师范大学学报(自然科学版). 2012(04)
[9]基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J]. 黄名选,严小卫,张师超. 软件学报. 2009(07)
[10]信息检索中的相关反馈技术综述[J]. 严华云,刘其平,肖良军. 计算机应用研究. 2009(01)
博士论文
[1]正负相关反馈与查询扩展技术的研究[D]. 王俊义.内蒙古大学 2012
硕士论文
[1]基于EHR电子健康记录的临床医学文献检索研究[D]. 张悦.华中师范大学 2018
[2]个性化受限域问答系统研究[D]. 赵兴.昆明理工大学 2012
[3]全文检索及相关技术研究[D]. 林义明.辽宁科技大学 2012
本文编号:3173430
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:109 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 研究意义
1.3 研究内容
1.4 本文的组织结构
第二章 伪相关反馈技术研究现状
2.1 信息检索与伪相关反馈发展简述
2.1.1 信息检索技术
2.1.2 相关反馈与查询扩展技术
2.1.3 伪相关反馈技术
2.2 伪相关反馈技术相关研究概述
2.2.1 基于向量空间模型的伪相关反馈技术
2.2.2 基于语言模型的伪相关反馈技术
2.2.3 基于位置信息的伪相关反馈技术
2.2.4 基于深度学习模型的伪相关反馈技术
2.2.5 基于其他方法的伪相关反馈技术
2.3 本章小结
第三章 基于词项超空间语义的伪相关反馈查询扩展研究
3.1 引言
3.2 语义空间
3.3 超空间模拟语言
3.4 Rocchio伪相关反馈框架
3.5 基于词项超空间语义的伪相关反馈
3.5.1 词项超空间语义权重
3.5.2 融入词项超空间语义的伪相关反馈模型
3.5.3 归一化方法
3.6 实验相关设置
3.6.1 实验数据集及评价标准
3.6.2 基线模型
3.6.3 参数设置
3.7 实验结果和讨论
3.7.1 与基线模型比较
3.7.2 与其他伪相关反馈模型比较
3.7.3 归一化函数的对比分析
3.7.4 动态自适应窗口值分析
3.7.5 实验结果与讨论
3.7.6 局限性
3.8 本章小结
第四章 基于核函数词项共现语义的伪相关反馈查询扩展研究
4.1 引言
4.2 基于核函数词项共现的伪相关反馈方法
4.2.1 传统的PRF模型框架
4.2.2 核函数词项共现语义权重
4.2.3 基于核函数的词项共现语义框架
4.3 实验设置
4.3.1 数据集和评价标准
4.3.2 基线模型和其他相关对比模型介绍
4.3.3 参数设置
4.4 实验设计、结果与分析
4.4.1 基准实验
4.4.2 与强基线模型比较
4.4.3 与重要的伪相关反馈模型比较
4.4.4 参数敏感性
4.4.5 分析和讨论
4.5 本章小结
第五章 基于BERT模型句子潜在语义的伪相关反馈查询扩展研究
5.1 引言
5.2 句子语义
5.2.1 句子向量
5.2.2 句子的向量表示
5.2.3 句子语义相似度计算—BERT模型
5.3 基于BERT模型句子语义相似度的伪相关反馈方法
5.3.1 基于BERT的句子语义特征
5.3.2 融入句子语义特征到Rocchio模型
5.4 实验设置和结果分析
5.4.1 实验设置
5.4.2 与强基线模型比较
5.4.3 与其他经典的模型比较
5.4.4 参数敏感性
5.5 本章小结
第六章 总结和展望
6.1 全文总结
6.2 未来工作
参考文献
研究成果及参与的科研项目
研究成果
已发表的科研论文
已投的科研论文
国家发明专利
软件著作权
参与的科研项目
致谢
【参考文献】:
期刊论文
[1]一种基于Hownet的词向量表示方法[J]. 陈洋,罗智勇. 北京大学学报(自然科学版). 2019(01)
[2]基于词语关系的词向量模型[J]. 蒋振超,李丽双,黄德根. 中文信息学报. 2017(03)
[3]相关反馈在信息检索中的研究综述[J]. 于莹莹,陈燕,张金松. 情报理论与实践. 2016(12)
[4]基于检索结果排序的伪相关反馈[J]. 闫蓉,高光来. 计算机应用. 2016(08)
[5]基于分类模型的查询扩展方法[J]. 李维银,石玉龙,陈杰,施重阳. 计算机科学. 2015(06)
[6]医学信息检索中一种基于概念的查询相关模型[J]. 李纲,毛进,芦昆. 情报学报. 2014 (03)
[7]双语主题跨语言伪相关反馈[J]. 王序文,王小捷,孙月萍. 北京邮电大学学报. 2013(04)
[8]基于Markov网络团的查询意图识别[J]. 蔡桂秀,王明文,揭安全,王晓庆. 江西师范大学学报(自然科学版). 2012(04)
[9]基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J]. 黄名选,严小卫,张师超. 软件学报. 2009(07)
[10]信息检索中的相关反馈技术综述[J]. 严华云,刘其平,肖良军. 计算机应用研究. 2009(01)
博士论文
[1]正负相关反馈与查询扩展技术的研究[D]. 王俊义.内蒙古大学 2012
硕士论文
[1]基于EHR电子健康记录的临床医学文献检索研究[D]. 张悦.华中师范大学 2018
[2]个性化受限域问答系统研究[D]. 赵兴.昆明理工大学 2012
[3]全文检索及相关技术研究[D]. 林义明.辽宁科技大学 2012
本文编号:3173430
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3173430.html