基于用户特征分析的查询扩展技术研究与应用
发布时间:2017-09-24 01:39
本文关键词:基于用户特征分析的查询扩展技术研究与应用
更多相关文章: 检索扩展 特征模型 Lucene 本体 语义关联度计算
【摘要】:从20世纪末到现在,搜索引擎在为人们查找信息给予了很大的方便,但是它无法提供完全令用户满意的结果。在现今的搜索引擎的使用过程中,由于用户查询语句过短而导致的词不匹配、信息迷向和信息超载等问题,成为制约检索质量的主要因素之一。另外,大部分搜索引擎没有考虑到各个用户的差异性特征,导致检索结果含有较多无用的信息,准确率较低。因此,信息检索系统应该能够区别对待不同用户的查询请求,按照一定的策略为原查询词附加更多的关键词,来解决用户查询信息不完整的问题。本文阐明了在相关领域内的科研意义和技术背景,介绍了国际国内相关方面的研究成果,简单叙述了和本文相关的重要技术以及理论,将查询扩展技术应用到了基于Lucene的检索系统中,通过对实验结果进行的分析证明了该技术的有效性。主要做的工作如下所示:介绍了以用户特征模型为基础的查询扩展方法,论文以本体技术构造了用户特征模型,并且根据用户模型来扩展用户输入的检索词,借此使用户的搜索过程更加便利。另外,根据查询者的日志文件,考虑到不同人的差异性特征,区别各用户的的检索意图,以防止发生检索结果大大偏离用户原本意愿的情况。在研究和参考Lucene结构的基础上,提出了一种以Lucene为基础的数据库查询系统(database retrieval system based-Lucene),通过实验证明,该系统显着提高了数据库检索的效率和召回率,能够较好地满足查询者的检索需求。本文将基于用户特征模型的扩展技术应用到了基于Lucene索引的全文查询系统中,能够根据查询者的差异性特征来对其检索条件扩展,查询结果可以较好地满足搜索者的查询意图。
【关键词】:检索扩展 特征模型 Lucene 本体 语义关联度计算
【学位授予单位】:长春工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
- 摘要2-3
- Abstract3-6
- 第一章 绪论6-10
- 1.1 论文选题来源及研究意义6
- 1.2 国内外研究现状6-8
- 1.3 论文的结构安排8-10
- 第二章 相关基础知识及关键方法10-17
- 2.1 信息检索10-11
- 2.2 搜索引擎11-13
- 2.3 本体概述13-14
- 2.4 Lucene概述14-17
- 第三章 依托于用户模型的检索扩展技术研究17-27
- 3.1 基于用户模型的查询扩展原理17-21
- 3.1.1 用户模型的简介17
- 3.1.2 用户特征模型的构建17-20
- 3.1.3 查询扩展的流程20-21
- 3.2 查询扩展算法21-24
- 3.2.1 语义关联度21
- 3.2.2 词项相似度21-23
- 3.2.3 以关联度和相似度为基础的检索扩展方法23-24
- 3.3 控制“查询漂移”现象24-25
- 3.4 实验验证25-27
- 3.4.1 实验环境25
- 3.4.2 实验过程25-27
- 第四章 以Lucene为基础的数据库查询研究27-37
- 4.1 序言27
- 4.2 Lucene的索引27-28
- 4.2.1 Lucene概述27-28
- 4.2.2 索引的层次28
- 4.3 以Lucene为基础的数据库查询28-34
- 4.3.1 DRSB的层次28-29
- 4.3.2 数据库的索引层次29-30
- 4.3.3 数据库的倒排索引结构30-32
- 4.3.4 词频位置加权排序法32-33
- 4.3.5 以索引为基础的查询33-34
- 4.3.6 DRSB查询与数据库查询对比34
- 4.4 实验结果及实验分析34-37
- 4.4.1 实验的环境34-35
- 4.4.2 实验的结果35-36
- 4.4.3 实验分析36-37
- 第五章 查询扩展技术在全文检索系统中的应用37-41
- 5.1 系统概述37
- 5.2 系统的主要模块37-38
- 5.3 Lucene索引库的构建38
- 5.4 实验结果及分析38-41
- 5.4.1 实验结果38-40
- 5.4.2 实验分析40-41
- 第六章 结论41-42
- 致谢42-43
- 参考文献43-46
- 作者简介46
- 攻读硕士学位期间研究成果46-47
【参考文献】
中国期刊全文数据库 前10条
1 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期
2 祝伟华;张正龙;刘斌斌;;基于全文检索工具包Lucene的排序技术[J];重庆工学院学报(自然科学版);2008年12期
3 张雪源;贺前华;李艳雄;叶婉玲;;一种基于倒排索引的音频检索方法[J];电子与信息学报;2012年11期
4 范晨熙;黄理灿;李雪利;;基于Lucene的BM25模型的评分机制的研究[J];工业控制计算机;2013年03期
5 薛涵;秦兵;刘挺;;基于Folksonomy的本体构建综述[J];电子学报;2014年04期
6 金贵阳;吕福在;项占琴;;基于知识图谱和语义网技术的企业信息集成方法[J];东南大学学报(自然科学版);2014年02期
7 纪海;曹三省;;基于互联网融合媒体的大数据应用技术分析[J];电视技术;2014年21期
8 孟祥娜;秦玉平;;一种基于分类和语义查询扩展的信息检索方法[J];信息技术;2010年09期
9 杨劲松;凌培亮;;搜索引擎PageRank算法的改进[J];计算机工程;2009年22期
10 王欢;孙瑞志;;基于领域本体和Lucene的语义检索系统研究[J];计算机应用;2010年06期
,本文编号:908638
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/908638.html