当前位置:主页 > 科技论文 > 搜索引擎论文 >

查询意图识别的关键技术研究

发布时间:2017-11-16 09:34

  本文关键词:查询意图识别的关键技术研究


  更多相关文章: 查询意图 查询领域识别 意图识别 概念体系 意图特征模板 关键词抽取


【摘要】:随着网络上信息的爆炸式增长,搜索引擎扮演着越来越重要的角色。当前的搜索引擎主要是通过计算用户查询和文档的相似度来返回检索结果的。然而基于相似度的搜索方式仅仅会返回包含查询关键词的网页,而没有对查询背后用户真正的需求进行识别与匹配。对于具有复杂信息需求的查询,搜索引擎返回的搜索结果往往包含有较多不符合用户需求的噪声网页,从而无法充分满足用户需求。因此,进行用户查询意图识别的相关研究,深入理解用户的查询意图是十分必要的。到目前为止,使用最为广泛的意图类别体系是Broder提出的“信息类,导航类,事务类”这三种意图类型。本文对查询意图的类别进行了新的定义,新定义的意图类别体系是基于某一特定的领域的,本文定义的查询意图分为三类:获取实体的属性值、查找某个实体的相关信息以及对某一实体的操作。本文的研究工作主要围绕下面两点进行:第一,通过分类的方法对查询进行领域识别;第二,在特定领域下,对查询的意图类型进行识别,并抽取查询关键词,最后生成查询意图解析结果。查询领域识别的问题转化为查询的分类问题,但是对查询进行分类主要存在两个问题:首先,用户查询的长度较短,从查询中所能抽取到的特征比较稀疏;其次,基于机器学习的分类方法需要一定规模的训练数据,而人工地对大规模的查询进行领域标注是不现实的。本文借助百度百科中的在线知识对查询进行特征扩展,解决了查询特征稀疏的问题;本文利用网页分类导航网站对网页URL进行领域标注,对查询日志进行统计分析,得到查询点击URL的分布,根据URL所属领域实现对查询领域的自动标注。特定领域下查询意图的识别是本文研究的另一个重点。首先,本文构建了基本概念体系和领域意图知识库,基本概念体系不仅对通用的词汇(比如时间、地点等)进行了概念抽象,同时也对领域内的专名词典构筑了概念体系;领域意图知识库的构建需要对领域内实体、属性、意图特征模板进行挖掘。其次,基于基本概念体系和领域意图知识库,对某一领域的查询进行意图解析,并抽取查询关键词,生成查询意图解析结果。综上,本文的贡献度主要表现在:基于查询点击日志实现查询领域类别的自动标注;借助百度百科对查询进行特征扩展;提出新的查询意图的类别体系;引入了意图特征的概念实现对查询的意图识别。最终的实验结果表明,基于查询扩展的查询领域分类具有较高的准确率;同时,对特定领域下查询意图识别的覆盖度较高,并且意图解析结果具有较高的准确率和召回率。
【学位授予单位】:东北大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3

【相似文献】

中国期刊全文数据库 前10条

1 陆伟;周红霞;张晓娟;;查询意图研究综述[J];中国图书馆学报;2013年01期

2 张晓娟;陆伟;;利用查询重构识别查询意图[J];现代图书情报技术;2013年01期

3 江雪;孙乐;;用户查询意图切分的研究[J];计算机学报;2013年03期

4 白露;郭嘉丰;曹雷;程学旗;;基于查询意图的长尾查询推荐[J];计算机学报;2013年03期

5 周之诚;;基于查询意图聚类的实时搜索建议[J];现代图书情报技术;2011年02期

6 唐静笑;吕学强;柳成洋;李涵;;用户查询意图的层次化识别方法[J];现代图书情报技术;2014年01期

7 文军,文贵华,丁月华;面向查询意图的搜索引擎设计与实现[J];计算机应用研究;2002年10期

8 张美珍;王治莹;;基于用户查询意图的搜索排序算法[J];天津理工大学学报;2012年03期

9 伍大勇;赵世奇;刘挺;张宇;;融合多类特征的Web查询意图识别[J];模式识别与人工智能;2012年03期

10 吴晓晖;宋萍萍;张荣欣;;有无查询意图的分类与实现架构模型研究[J];情报科学;2009年12期

中国重要会议论文全文数据库 前3条

1 王俞霖;孙乐;黄云平;李文波;;基于规则和类型还原的用户查询意图识别[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

2 高莺;沈洁;陈沧;刘春阳;叶君峰;;一种基于排序学习的查询意图预测算法[A];第五届全国信息检索学术会议论文集[C];2009年

3 华松;洪宇;张剑峰;姚建民;朱巧明;;基于相关子主题消解的悖向重排序方法研究[A];第六届全国信息检索学术会议论文集[C];2010年

中国博士学位论文全文数据库 前1条

1 宋巍;基于主题的查询意图识别研究[D];哈尔滨工业大学;2013年

中国硕士学位论文全文数据库 前10条

1 白鹏超;分布式搜索引擎核心技术的研究与实现[D];辽宁科技大学;2015年

2 张杨浩;基于搜索引擎日志的查询意图分类研究[D];西南大学;2016年

3 崔建青;查询意图识别的关键技术研究[D];东北大学;2014年

4 张恒庆;网络用户查询意图分析[D];北京工业大学;2014年

5 王井丰;基于百度百科的查询意图分类[D];吉林大学;2013年

6 张苗;基于用户查询意图的信息检索技术研究与实现方法[D];湖南大学;2013年

7 胡刚;百科知识与统计方法结合的查询意图分类[D];哈尔滨工业大学;2011年

8 陈杰;基于Web检索的查询意图分类研究[D];华南理工大学;2011年

9 蔡桂秀;基于Markov网络团的查询意图识别[D];江西师范大学;2012年

10 张培英;基于用户行为的用户查询意图分析方法及研究[D];西华大学;2011年



本文编号:1191934

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1191934.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c1f64***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com