查询意图自动分类与分析
发布时间:2025-01-13 23:14
当今时代,信息呈指数级增长,信息社会给用户带来丰富信息的同时,也使得用户在信息海洋中容易迷失方向。从海量的信息资源中准确、快速地获取所需信息成为信息服务者不断努力的方向,在此背景下,搜索引擎成为了帮助用户快速定位到互联网资源并获取相关信息的重要工具。然而,用户向搜索引擎输入的简短查询存在模糊性和歧义性,通常只能粗略地表达用户信息需求,因此,用户迫切希望搜索引擎能自动识别查询中包含的用户意图,直接返回与其信息需求相关的文档。于是,查询意图(即查询中应包含的用户信息需求、目标等)识别是当前学界和业界一研究热点。 其中,给定类目体系下的查询意图分类是查询意图识别的重要研究方向。当前的此类研究大多基于Broder提出的分类体系(即将查询意图分为信息类、导航类和事务类)进行,且主要工作是探讨如何对信息类和导航类进行有效区分,而对如何实现信息类、事务和导航类三者自动分类的研究甚少。另查询意图的分类信息需最终用于指导搜索引擎性能优化中,而当前对如何利用查询意图分类信息来指导搜索引擎优化的探讨较少。 基于此,本文首先实现信息类、导航类与事务类的自动分类,且在此基础上,首次尝试从搜索引擎稳定性、个...
【文章页数】:175 页
【学位级别】:博士
【文章目录】:
论文创新点
图目录
表目录
摘要
Abstract
0 引言
0.1 选题背景与研究意义
0.1.1 选题背景
0.1.2 研究意义
0.2 国内外研究现状分析
0.2.1 查询意图研究现状
0.2.2 搜索引擎稳定性研究现状
0.2.3 查询个性化潜力研究现状
0.2.4 网络动态研究现状
0.2.5 研究述评
0.3 研究方法与研究思路
0.3.1 研究方法
0.3.2 研究思路
0.4 研究内容与创新
0.4.1 研究内容
0.4.2 研究创新
1 相关理论基础
1.1 基于认知的信息检索模型
1.1.1 信息需求表达研究
1.1.2 相关性研究
1.2 查询意图相关理论
1.2.1 查询意图概念界定
1.2.2 查询意图理解维度
1.2.3 查询意图分类体系
1.2.4 查询意图分析维度
2 查询意图自动分类
2.1 查询意图分类体系构建
2.2 查询意图分类的相关方法
2.2.1 查询表示方法
2.2.2 查询意图特征选取
2.2.3 查询意图分类算法
2.2.4 查询意图分类效果评测
2.3 查询意图分类的难点
2.4 查询意图特征选取
2.4.1 已有提出的查询意图特征
2.4.2 本文提出的查询意图特征
2.5 实验及其结果分析
2.5.1 数据集获取
2.5.2 人工标注
2.5.3 查询会话切分
2.5.4 查询处理
2.5.5 实验设计
2.5.6 实验结果分析
2.6 实验总结
3 查询意图的搜索引擎稳定性分析
3.1 搜索引擎稳定性概述
3.1.1 搜索引擎不稳定的原因
3.1.2 搜索引擎稳定性的概念界定
3.2 衡量搜索引擎稳定性的方法
3.2.1 基于重叠的方法
3.2.2 Spearman's footrule方法
3.2.3 Kendall tau方法
3.2.4 Fagin's方法
3.3 数据集获取
3.3.1 搜索引擎的选取
3.3.2 实验数据的获取
3.4 查询意图的同一搜索引擎稳定性分析
3.4.1 基于Purl与Turl指标的稳定性分析
3.4.2 基于Kendall tau距离的稳定性分析
3.5 查询意图的不同搜索引擎之间稳定性分析
3.6 实验总结
3.6.1 实验小结
3.6.2 相关建议
4 查询意图的个性化潜力分析
4.1 查询个性化潜力概述
4.2 衡量个性化潜力的相关指标
4.2.1 显式评测指标
4.2.2 隐式评测指标
4.3 实验数据来源
4.3.1 人工评测数据集
4.3.2 其它数据集
4.4 实验结果分析
4.4.1 查询意图的个性化潜力分析
4.4.2 不同指标之间的相关性分析
4.4.3 查询意图的表征个性化潜力的查询特征分析
4.5 实验总结
4.5.1 实验小结
4.5.2 相关建议
5 查询意图的网络动态分析
5.1 衡量网络动态的方法
5.1.1 衡量查询动态的方法
5.1.2 衡量信息需求动态的方法
5.1.3 衡量文档动态的方法
5.2 数据集获取
5.3.1 查询与结果集的选择
5.3.2 基于人工评测的数据
5.3 实验结果分析
5.3.1 查询意图的查询动态分析
5.3.2 查询意图的文档动态分析
5.3.3 查询意图随查询动态的文档动态分析
5.3.4 查询意图随查询动态的信息需求动态分析
5.4 实验总结
5.4.1 实验小结
5.4.2 相关建议
6 研究总结与展望
6.1 研究总结
6.2 研究展望
中英文参考文献
攻博期间科研成果列表
致谢
本文编号:4026041
【文章页数】:175 页
【学位级别】:博士
【文章目录】:
论文创新点
图目录
表目录
摘要
Abstract
0 引言
0.1 选题背景与研究意义
0.1.1 选题背景
0.1.2 研究意义
0.2 国内外研究现状分析
0.2.1 查询意图研究现状
0.2.2 搜索引擎稳定性研究现状
0.2.3 查询个性化潜力研究现状
0.2.4 网络动态研究现状
0.2.5 研究述评
0.3 研究方法与研究思路
0.3.1 研究方法
0.3.2 研究思路
0.4 研究内容与创新
0.4.1 研究内容
0.4.2 研究创新
1 相关理论基础
1.1 基于认知的信息检索模型
1.1.1 信息需求表达研究
1.1.2 相关性研究
1.2 查询意图相关理论
1.2.1 查询意图概念界定
1.2.2 查询意图理解维度
1.2.3 查询意图分类体系
1.2.4 查询意图分析维度
2 查询意图自动分类
2.1 查询意图分类体系构建
2.2 查询意图分类的相关方法
2.2.1 查询表示方法
2.2.2 查询意图特征选取
2.2.3 查询意图分类算法
2.2.4 查询意图分类效果评测
2.3 查询意图分类的难点
2.4 查询意图特征选取
2.4.1 已有提出的查询意图特征
2.4.2 本文提出的查询意图特征
2.5 实验及其结果分析
2.5.1 数据集获取
2.5.2 人工标注
2.5.3 查询会话切分
2.5.4 查询处理
2.5.5 实验设计
2.5.6 实验结果分析
2.6 实验总结
3 查询意图的搜索引擎稳定性分析
3.1 搜索引擎稳定性概述
3.1.1 搜索引擎不稳定的原因
3.1.2 搜索引擎稳定性的概念界定
3.2 衡量搜索引擎稳定性的方法
3.2.1 基于重叠的方法
3.2.2 Spearman's footrule方法
3.2.3 Kendall tau方法
3.2.4 Fagin's方法
3.3 数据集获取
3.3.1 搜索引擎的选取
3.3.2 实验数据的获取
3.4 查询意图的同一搜索引擎稳定性分析
3.4.1 基于Purl与Turl指标的稳定性分析
3.4.2 基于Kendall tau距离的稳定性分析
3.5 查询意图的不同搜索引擎之间稳定性分析
3.6 实验总结
3.6.1 实验小结
3.6.2 相关建议
4 查询意图的个性化潜力分析
4.1 查询个性化潜力概述
4.2 衡量个性化潜力的相关指标
4.2.1 显式评测指标
4.2.2 隐式评测指标
4.3 实验数据来源
4.3.1 人工评测数据集
4.3.2 其它数据集
4.4 实验结果分析
4.4.1 查询意图的个性化潜力分析
4.4.2 不同指标之间的相关性分析
4.4.3 查询意图的表征个性化潜力的查询特征分析
4.5 实验总结
4.5.1 实验小结
4.5.2 相关建议
5 查询意图的网络动态分析
5.1 衡量网络动态的方法
5.1.1 衡量查询动态的方法
5.1.2 衡量信息需求动态的方法
5.1.3 衡量文档动态的方法
5.2 数据集获取
5.3.1 查询与结果集的选择
5.3.2 基于人工评测的数据
5.3 实验结果分析
5.3.1 查询意图的查询动态分析
5.3.2 查询意图的文档动态分析
5.3.3 查询意图随查询动态的文档动态分析
5.3.4 查询意图随查询动态的信息需求动态分析
5.4 实验总结
5.4.1 实验小结
5.4.2 相关建议
6 研究总结与展望
6.1 研究总结
6.2 研究展望
中英文参考文献
攻博期间科研成果列表
致谢
本文编号:4026041
本文链接:https://www.wllwen.com/tushudanganlunwen/4026041.html