一种基于语义单元的查询扩展方法
本文关键词: 信息检索 查询扩展 搜索引擎 语义单元 出处:《计算机科学》2008年02期 论文类型:期刊论文
【摘要】:查询扩展技术通过向初始查询请求中加入相似或者相关的词,来减少查询请求与相关文献在表达上的不匹配现象,改善检索性能。本文利用语义单元的语义表达能力和语义单元之间的关系,将与初始查询具有密切语义关系的查询词或短语加入到初始查询请求中,更加全面地表示了用户的查询意愿。算法的时间复杂度为O(L),只与搜索请求的长度L有关,与语义单元表示库的规模无关,这对实时性要求较高的搜索引擎来讲是很实用的。
[Abstract]:Query expansion technology reduces the mismatch between query request and related literature by adding similar or related words to the initial query request. To improve retrieval performance. In this paper, the semantic expression of semantic units and the relationship between semantic units, the query terms or phrases with close semantic relationship with the initial query are added to the initial query request. The time complexity of the algorithm is only related to the length of the search request L, and is independent of the size of the semantic unit representation library. This is very practical for the search engine with high real-time requirements.
【作者单位】: 北京科技大学信息工程学院 北京科技大学信息工程学院
【基金】:国家863高技术研究发展计划项目基金(2006AA012140) 国家自然科学基金项目(60573014)的资助
【分类号】:TP301.6
【正文快照】: 1引言在网络信息检索系统中,语言中大量存在的同义、多义、上下义等语义关系使得语言的表达方式多种多样。而用户提交的初始查询请求是用户搜索意愿的某一种表达方式,这种特定的表达形式使得原本具有语义联系,但是以其他表达形式表示的相关网页无法被搜索引擎搜索到,导致相关
【相似文献】
相关期刊论文 前10条
1 黄名选;朱家安;冯平;;基于正负关联规则融合的信息检索模型[J];情报理论与实践;2011年07期
2 ;第七届全国信息检索学术会议(CCIR 2011)征文通知[J];模式识别与人工智能;2011年03期
3 黄名选;马瑞兴;兰慧红;;面向查询扩展的特征词频繁项集挖掘算法[J];现代图书情报技术;2011年04期
4 黄名选;朱家安;陈燕红;;面向查询扩展的词间正负关联规则挖掘算法[J];计算机工程与应用;2011年26期
5 顾小林;卞艺杰;浦徐进;;基于改进KS方法的食品安全追溯信息检索模型[J];软科学;2011年08期
6 张文慧;张冉;;基于中文分词的农业信息检索平台设计[J];安徽农业科学;2011年20期
7 杨永健;;浅议图书馆新型OPAC系统发展趋势——以汇文OPAC系统为例[J];四川图书馆学报;2011年03期
8 刘劲松;张彬;柴文磊;魏建行;刘振鹏;;校园网园区搜索引擎的设计与实现[J];河北大学学报(自然科学版);2011年04期
9 吴庆涛;芮跃峰;张卫星;;个性化搜索引擎中的用户兴趣模型分析与研究[J];现代计算机;2011年08期
10 艾丹祥;左晖;杨君;;网络信息检索中相关反馈技术的Java实现[J];电脑知识与技术;2011年16期
相关会议论文 前10条
1 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年
2 王秉卿;张奇;吴立德;黄萱菁;;机器学习的查询扩展在博客检索中的应用[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 刘全升;姚天f ;;基于关联度模型的文本倾向性检索研究[A];第六届全国信息检索学术会议论文集[C];2010年
4 丁国栋;白硕;王斌;;一种基于局部共现的查询扩展方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 周博;岑荣伟;刘奕群;张敏;马少平;;相关反馈任务中一种基于文档相似度的检索结果重排序方法[A];第五届全国信息检索学术会议论文集[C];2009年
6 罗伟;李陶深;;一种基于本体的个性化搜索引擎模型[A];广西计算机学会2006年年会论文集[C];2006年
7 ;编者的话[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
8 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
9 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
10 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
相关重要报纸文章 前10条
1 希安;微软试水信息检索[N];经济日报;2004年
2 本报记者 潘永花;组件化平台提升信息检索效率[N];网络世界;2003年
3 柏荣;国家973项目在因特网大规模信息检索领域取得突破[N];中国高新技术产业导报;2003年
4 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年
5 于振海;Microsoft Office 2003的翻译服务你用了吗?[N];中国电脑教育报;2004年
6 高丽华;信息化遭遇新雷区[N];计算机世界;2007年
7 李茂 编译;创新是技术素养的第一要求[N];中国教师报;2007年
8 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
9 西安 张树忠 时剑;如何使用Word 2003翻译功能[N];电子报;2004年
10 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;“海”中捞“珍”[N];计算机世界;2003年
相关博士学位论文 前10条
1 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
2 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
3 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
4 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
5 蒲强;基于独立分量分析的语义聚类技术在信息检索中的应用研究[D];电子科技大学;2010年
6 吴定峰;基于本体的语义搜索模型研究[D];中国农业科学院;2012年
7 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
8 丁国栋;基于统计语言建模的信息检索及相关研究[D];中国科学院研究生院(计算技术研究所);2006年
9 董道国;高维数据索引结构研究[D];复旦大学;2005年
10 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
相关硕士学位论文 前10条
1 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年
2 罗建利;基于用户兴趣的概念查询扩展研究[D];扬州大学;2005年
3 王水利;基于互信息的语义查询扩展技术研究[D];河南科技大学;2011年
4 方勇;基于语义的信息检索方法研究与应用[D];浙江大学;2010年
5 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
6 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
7 方芳;中文信息检索系统与文档重排技术研究[D];武汉科技大学;2010年
8 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年
9 胡珍新;面向用户的查询扩展研究与实现[D];江西师范大学;2004年
10 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
,本文编号:1475514
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1475514.html