用户查询意图的层次化识别方法
本文关键词:用户查询意图的层次化识别方法
【摘要】:【目的】向搜索引擎提交的查询均有其潜在的查询意图,准确识别查询意图可以提高查询的效率。【方法】针对有明显意图的查询,采用滑动窗口寻找最大公共子串的策略抽取用户的意图模板,然后用模板匹配的方法识别用户查询意图。对无明显意图的查询,采用多特征融合的分类方法进行识别。【结果】实验结果表明,采用层次化识别方法和单独使用分类器方法相比,识别查询意图的实验结果正确率得到19.04%的提升。【局限】可获得的意图模板是有限的,因此显式意图查询的识别存在局限性。大规模数据情况下,模式匹配及机器学习算法的运算量很大,需要进一步优化算法。【结论】实验证明该方法在Web意图识别中是有效的,对意图识别率的提高有积极意义。
【作者单位】: 北京信息科技大学网络文化与数字传播北京市重点实验室;中国标准化研究院;
【关键词】: 信息检索 查询意图 层次化识别 意图模板
【基金】:国家自然科学基金项目“基于本体的专利自动标引研究”(项目编号:61271304) 北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目“面向领域的互联网多模态信息精准搜索方法研究”(项目编号:KZ201311232037)的研究成果之一
【分类号】:TP391.3
【正文快照】: 1引言互联网上数据庞大,以指数级形式增长,搜索引擎已经成为人们浏览互联网信息的一个主要手段。获取用户查询意图以及对用户查询意图分类是当前的热点研究问题。如果能够理解隐藏在用户查询背后的意图,就能够帮助搜索引擎自动将查询提交到相对应的垂直搜索引擎上,得到更加准
【参考文献】
中国期刊全文数据库 前6条
1 袁鼎荣;钟宁;张师超;;文本信息处理研究述评[J];计算机科学;2011年02期
2 伍大勇;赵世奇;刘挺;张宇;;融合多类特征的Web查询意图识别[J];模式识别与人工智能;2012年03期
3 修驰;宋柔;;基于无监督学习的专业领域分词歧义消解方法[J];计算机应用;2013年03期
4 吴晓晖;宋萍萍;张荣欣;;有无查询意图的分类与实现架构模型研究[J];情报科学;2009年12期
5 王大玲;于戈;鲍玉斌;张沫;沈洲;;基于用户搜索意图的Web网页动态泛化[J];软件学报;2010年05期
6 张晓娟;陆伟;;利用查询重构识别查询意图[J];现代图书情报技术;2013年01期
【共引文献】
中国期刊全文数据库 前10条
1 任剑锋;梁雪;李淑红;;基于非线性流形学习和支持向量机的文本分类算法[J];计算机科学;2012年01期
2 杨艺;周元;;基于用户查询意图识别的Web搜索优化模型[J];计算机科学;2012年01期
3 肖婷;陈红英;;基于可信度的Web信息搜索主动服务研究[J];计算机与现代化;2011年05期
4 贾长云;梁海军;;基于B-ISVM算法的物联网云存储数据伪装不良信息检测[J];计算机科学;2013年02期
5 戴璐;丁立新;薛兵;;一种摘要中隐含的知识片段的挖掘方案[J];计算机科学;2013年02期
6 蔡宇;杨广超;;基于语义核函数的问句检索系统的实现[J];情报科学;2011年11期
7 吴晓晖;廖家艳;陈延寿;;中外搜索引擎对比与研究热点分析[J];情报杂志;2010年12期
8 任豪栋;贾年;;基于用户相似度计算的导航类意图分类研究[J];西华大学学报(自然科学版);2011年03期
9 张小琴;王晓辉;;主题信息搜索系统中的搜索策略研究[J];软件导刊;2014年01期
10 陆伟;周红霞;张晓娟;;查询意图研究综述[J];中国图书馆学报;2013年01期
中国博士学位论文全文数据库 前1条
1 伍大勇;搜索引擎中命名实体查询处理相关技术研究[D];哈尔滨工业大学;2012年
中国硕士学位论文全文数据库 前5条
1 孙凯;自动答疑系统中的问句理解与个性化推荐算法研究[D];南京信息工程大学;2011年
2 韩国兴;面向移动搜索的PUSH平台的设计与实现[D];哈尔滨工程大学;2011年
3 段焕中;事务类搜索意图分类模型研究[D];北京邮电大学;2012年
4 安冲;一种在搜索日志中挖掘用户搜索意图并推荐相关搜索词的方法[D];北京邮电大学;2013年
5 夏徵;安立通讯人事管理系统的设计与实现[D];大连理工大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 罗智勇;宋柔;;基于多特征的自适应新词识别[J];北京工业大学学报;2007年07期
2 唐培丽,王树明,胡明;基于语义的汉语文献主题词提取算法研究[J];吉林大学学报(信息科学版);2005年05期
3 傅赛香,袁鼎荣,黄柏雄,钟智;基于统计的无词典分词方法[J];广西科学院学报;2002年04期
4 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
5 马颖华,王永成,苏贵洋,张宇萌;一种基于字同现频率的汉语文本主题抽取方法[J];计算机研究与发展;2003年06期
6 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
7 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
8 罗智勇;宋柔;;现代汉语通用分词系统中歧义切分的实用技术[J];计算机研究与发展;2006年06期
9 李鑫;黄萱菁;吴立德;;基于错误驱动算法组合分类器及其在问题分类中的应用[J];计算机研究与发展;2008年03期
10 郝秀兰;陶晓鹏;徐和祥;胡运发;;kNN文本分类器类偏斜问题的一种处理对策[J];计算机研究与发展;2009年01期
【相似文献】
中国期刊全文数据库 前10条
1 舒江波;胡金柱;肖升;;基于语法的信息检索模型研究——信息检索方法的一个新分支[J];情报理论与实践;2011年04期
2 王诚,张t,
本文编号:1022951
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1022951.html