基于用户查询意图识别的个性化搜索方法研究
本文关键词:基于用户查询意图识别的个性化搜索方法研究
更多相关文章: 用户查询意图 查询扩展 用户模型 LDA 个性化搜索
【摘要】:随着互联网信息的快速增长,用户在使用传统搜索引擎进行信息检索时,经常会获得海量搜索结果,这些结果大多与用户搜索意图相去甚远。用户往往对这些信息无所适从,这造成了严重的信息过载。人们迫切希望在信息检索过程中,搜索引擎能理解其个性化信息需求,返回与其查询意图高度匹配的搜索结果。鉴于此,本文提出了一种基于用户查询意图识别的个性化搜索框架,该搜索框架主要包括以下四个部分:首先,对搜索语料库上的文档集进行预处理,并在该语料库上构建统一的概率主题模型C-LDA;其次,针对每个搜索引擎用户,利用C-LDA求出其搜索历史文档的主题概率分布并以此作为其用户模型;再者,用户进行信息检索时,利用C-LDA和用户模型对其查询意图进行个性化识别;最后,搜索引擎对初始查询进行基于用户意图和局部共现的查询扩展,并将最终结果返回给用户。本文的创新工作如下:(1)针对现有的基于主题的用户建模方法准确度不高的问题,本文提出了一种利用搜索语料库的公共LDA模型来构建用户模型的方法。通过与直接在用户搜索历史文档中使用概率主题模型的方法相比,NDCG值分别提高了1.7%。(2)针对现在查询扩展中用户意图识别较难的问题,提出了一种新的用户查询意图识别方法。即利用查询主题和用户模型识别其查询意图,而后基于用户查询意图和局部共现方法对其原查询进行查询扩展。通过与基于独立分量分析的语义聚类的查询扩展方法相比,我们的方法具有更好的性能,其中,Precision@5值提高了7.1%,Precision@10值提高了7.4%。
【关键词】:用户查询意图 查询扩展 用户模型 LDA 个性化搜索
【学位授予单位】:湘潭大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
- 摘要4-5
- Abstract5-8
- 第1章 绪论8-13
- 1.1 研究背景及意义8
- 1.2 国内外研究现状8-11
- 1.2.1 用户建建模8-9
- 1.2.2 用户查询意图识别9-10
- 1.2.3 查询扩展10-11
- 1.3 主要研究内容11-12
- 1.4 论文结构12-13
- 第2章 个性化搜索相关理论与技术13-22
- 2.1 Lucene13-16
- 2.2 用户模型16-18
- 2.3 主题模型18-21
- 2.3.1 主题模型概述18-19
- 2.3.2 LDA模型19-21
- 2.4 小结21-22
- 第3章 用户模型的构建与更新22-27
- 3.1 引言22-23
- 3.2 构建C-LDA模型23-24
- 3.2.1 文档预处理23
- 3.2.2 生成C-LDA模型23-24
- 3.3 用户建模24-25
- 3.4 用户模型更新25-26
- 3.5 小结26-27
- 第4章 基于用户意图的个性化查询扩展27-33
- 4.1 引言27-28
- 4.2 用户查询意图识别28-29
- 4.3 基于用户查询意图的相关文档排序29-31
- 4.4 基于用户意图和局部共现的查询扩展31-32
- 4.5 小结32-33
- 第5章 系统实现与结果评估33-46
- 5.1. 实验环境33
- 5.2 测评集和测评指标33-36
- 5.3 基于Lucene的个性化搜索引擎设计36-41
- 5.3.1 基于Lucene的搜索引擎实现36-38
- 5.3.2 个性化搜索38-41
- 5.4 主题模型的构建41
- 5.5 基于用户查询意图识别的个性化搜索41-45
- 5.5.1 用户建模42-43
- 5.5.2 基于用户意图的个性化查询扩展43-45
- 5.6 小结45-46
- 第6章 总结与展望46-48
- 6.1 论文总结46
- 6.2 未来工作展望46-48
- 参考文献48-51
- 致谢51-52
- 攻读硕士学位期间发表的论文和参与的科研项目52
【相似文献】
中国期刊全文数据库 前10条
1 袁柳;张龙波;;个性化搜索中的用户特征模型研究[J];计算机工程与应用;2011年15期
2 陈晨;李敏波;;基于本地插件的个性化搜索研究[J];计算机应用与软件;2011年05期
3 申艳光;王敏;范永健;;个性化搜索在农产品商务系统中的应用研究[J];安徽农业科学;2011年26期
4 斯蒂芬·卡斯;;个性化搜索[J];科技创业;2011年08期
5 桑艳艳;刘培刚;李勇;;拟合用户偏好的个性化搜索[J];情报科学;2008年08期
6 轩景泉;王玮;安正锋;;分布式教学资源的个性化搜索[J];吉林大学学报(信息科学版);2008年05期
7 俞伟明;打造个性化搜索菜单[J];电脑知识与技术;2004年16期
8 申艳光;王敏;范永健;;面向隐私保护的个性化搜索结果排序方法研究[J];数学的实践与认识;2011年19期
9 杨军;武秀川;郭艳燕;;基于跨系统的个性化搜索系统模型设计[J];微处理机;2013年03期
10 帅剑平;周娅;;基于聚类算法的个性化搜索研究[J];计算机系统应用;2009年01期
中国重要会议论文全文数据库 前2条
1 李家舒;曹守峰;范文庆;黄玮;;基于移动平台的黄页个性化搜索建模技术研究[A];第九届中国通信学会学术年会论文集[C];2012年
2 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
中国重要报纸全文数据库 前4条
1 李远;谷歌发布个性化搜索工具 可选属性保护个人隐私权[N];中华新闻报;2007年
2 Google(谷歌)中国研究院副院长 张智威;社区个性化搜索渐热 难在掌握用户信息[N];中国电子报;2008年
3 孙仲;传统搜索遭遇巨大挑战 个性化搜索将成趋势[N];中国高新技术产业导报;2009年
4 本报记者 吴艳;眼球操控世界:远在天边,近在眼前[N];中国知识产权报;2012年
中国博士学位论文全文数据库 前2条
1 靳婷;基于上下文与面向社会媒体的信息推荐方法研究[D];复旦大学;2014年
2 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
中国硕士学位论文全文数据库 前10条
1 马凌;基于微博的个性化搜索系统[D];湖南科技大学;2015年
2 林博;基于用户查询意图识别的个性化搜索方法研究[D];湘潭大学;2015年
3 刘俊晖;企业内部个性化搜索系统的研究与实现[D];复旦大学;2008年
4 杜中国;基于半监督聚类的个性化搜索研究[D];青岛理工大学;2011年
5 李雪;旅游个性化搜索系统的研究与实现[D];北京邮电大学;2013年
6 陈晨;基于兴趣多边形的个性化搜索系统的研究与实现[D];复旦大学;2010年
7 陈琛;基于社会化标签的个性化搜索研究[D];扬州大学;2008年
8 范慧;以博客内容为对象的个性化搜索研究[D];华中科技大学;2010年
9 王敏;个性化搜索中隐私保护的问题研究[D];河北工程大学;2012年
10 宋懿;电视节目的个性化搜索研究[D];上海交通大学;2008年
,本文编号:1048323
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1048323.html