当前位置:主页 > 科技论文 > 搜索引擎论文 >

用户查询意图的层次化识别方法

发布时间:2017-10-13 05:05

  本文关键词:用户查询意图的层次化识别方法


  更多相关文章: 信息检索 查询意图 层次化识别 意图模板


【摘要】:【目的】向搜索引擎提交的查询均有其潜在的查询意图,准确识别查询意图可以提高查询的效率。【方法】针对有明显意图的查询,采用滑动窗口寻找最大公共子串的策略抽取用户的意图模板,然后用模板匹配的方法识别用户查询意图。对无明显意图的查询,采用多特征融合的分类方法进行识别。【结果】实验结果表明,采用层次化识别方法和单独使用分类器方法相比,识别查询意图的实验结果正确率得到19.04%的提升。【局限】可获得的意图模板是有限的,因此显式意图查询的识别存在局限性。大规模数据情况下,模式匹配及机器学习算法的运算量很大,需要进一步优化算法。【结论】实验证明该方法在Web意图识别中是有效的,对意图识别率的提高有积极意义。
【作者单位】: 北京信息科技大学网络文化与数字传播北京市重点实验室;中国标准化研究院;
【关键词】信息检索 查询意图 层次化识别 意图模板
【基金】:国家自然科学基金项目“基于本体的专利自动标引研究”(项目编号:61271304) 北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目“面向领域的互联网多模态信息精准搜索方法研究”(项目编号:KZ201311232037)的研究成果之一
【分类号】:TP391.3
【正文快照】: 1引言互联网上数据庞大,以指数级形式增长,搜索引擎已经成为人们浏览互联网信息的一个主要手段。获取用户查询意图以及对用户查询意图分类是当前的热点研究问题。如果能够理解隐藏在用户查询背后的意图,就能够帮助搜索引擎自动将查询提交到相对应的垂直搜索引擎上,得到更加准

【参考文献】

中国期刊全文数据库 前6条

1 袁鼎荣;钟宁;张师超;;文本信息处理研究述评[J];计算机科学;2011年02期

2 伍大勇;赵世奇;刘挺;张宇;;融合多类特征的Web查询意图识别[J];模式识别与人工智能;2012年03期

3 修驰;宋柔;;基于无监督学习的专业领域分词歧义消解方法[J];计算机应用;2013年03期

4 吴晓晖;宋萍萍;张荣欣;;有无查询意图的分类与实现架构模型研究[J];情报科学;2009年12期

5 王大玲;于戈;鲍玉斌;张沫;沈洲;;基于用户搜索意图的Web网页动态泛化[J];软件学报;2010年05期

6 张晓娟;陆伟;;利用查询重构识别查询意图[J];现代图书情报技术;2013年01期

【共引文献】

中国期刊全文数据库 前10条

1 任剑锋;梁雪;李淑红;;基于非线性流形学习和支持向量机的文本分类算法[J];计算机科学;2012年01期

2 杨艺;周元;;基于用户查询意图识别的Web搜索优化模型[J];计算机科学;2012年01期

3 肖婷;陈红英;;基于可信度的Web信息搜索主动服务研究[J];计算机与现代化;2011年05期

4 贾长云;梁海军;;基于B-ISVM算法的物联网云存储数据伪装不良信息检测[J];计算机科学;2013年02期

5 戴璐;丁立新;薛兵;;一种摘要中隐含的知识片段的挖掘方案[J];计算机科学;2013年02期

6 蔡宇;杨广超;;基于语义核函数的问句检索系统的实现[J];情报科学;2011年11期

7 吴晓晖;廖家艳;陈延寿;;中外搜索引擎对比与研究热点分析[J];情报杂志;2010年12期

8 任豪栋;贾年;;基于用户相似度计算的导航类意图分类研究[J];西华大学学报(自然科学版);2011年03期

9 张小琴;王晓辉;;主题信息搜索系统中的搜索策略研究[J];软件导刊;2014年01期

10 陆伟;周红霞;张晓娟;;查询意图研究综述[J];中国图书馆学报;2013年01期

中国博士学位论文全文数据库 前1条

1 伍大勇;搜索引擎中命名实体查询处理相关技术研究[D];哈尔滨工业大学;2012年

中国硕士学位论文全文数据库 前5条

1 孙凯;自动答疑系统中的问句理解与个性化推荐算法研究[D];南京信息工程大学;2011年

2 韩国兴;面向移动搜索的PUSH平台的设计与实现[D];哈尔滨工程大学;2011年

3 段焕中;事务类搜索意图分类模型研究[D];北京邮电大学;2012年

4 安冲;一种在搜索日志中挖掘用户搜索意图并推荐相关搜索词的方法[D];北京邮电大学;2013年

5 夏徵;安立通讯人事管理系统的设计与实现[D];大连理工大学;2013年

【二级参考文献】

中国期刊全文数据库 前10条

1 罗智勇;宋柔;;基于多特征的自适应新词识别[J];北京工业大学学报;2007年07期

2 唐培丽,王树明,胡明;基于语义的汉语文献主题词提取算法研究[J];吉林大学学报(信息科学版);2005年05期

3 傅赛香,袁鼎荣,黄柏雄,钟智;基于统计的无词典分词方法[J];广西科学院学报;2002年04期

4 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期

5 马颖华,王永成,苏贵洋,张宇萌;一种基于字同现频率的汉语文本主题抽取方法[J];计算机研究与发展;2003年06期

6 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期

7 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期

8 罗智勇;宋柔;;现代汉语通用分词系统中歧义切分的实用技术[J];计算机研究与发展;2006年06期

9 李鑫;黄萱菁;吴立德;;基于错误驱动算法组合分类器及其在问题分类中的应用[J];计算机研究与发展;2008年03期

10 郝秀兰;陶晓鹏;徐和祥;胡运发;;kNN文本分类器类偏斜问题的一种处理对策[J];计算机研究与发展;2009年01期

【相似文献】

中国期刊全文数据库 前10条

1 舒江波;胡金柱;肖升;;基于语法的信息检索模型研究——信息检索方法的一个新分支[J];情报理论与实践;2011年04期

2 王诚,张t,

本文编号:1022951


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1022951.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d5d78***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com