搜索引擎倒排文件的一种分块组织技术
本文选题:搜索引擎 切入点:信息检索 出处:《电子学报》2005年02期 论文类型:期刊论文
【摘要】:检索效率对大规模信息检索系统至关重要 .本文基于Web搜索应用背景 ,针对用户查询的统计特性 ,提出了一种分块组织倒排文件的方法 .通过建立检索性能模型 ,进行分析和仿真实验 ,结果表明这一方法下的检索算法可以有效的减少检索执行时间 ,并得到这一组织方式中分块参数的优化选择方法 .
[Abstract]:The retrieval efficiency is very important for large-scale information retrieval system. Based on the background of Web search application and the statistical characteristics of user query, a method of organizing inverted files in blocks is proposed in this paper. The analysis and simulation results show that the retrieval algorithm under this method can effectively reduce the retrieval execution time and obtain the optimal selection method of block parameters in this organization.
【作者单位】: 北京大学计算机科学技术系 北京大学计算机科学技术系
【基金】:国家 973计划项目 (No G1 9990 32 70 6) 教育部博士点基金 (No 2 0 0 30 0 0 1 0 76)
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 熊宛星;薛开平;洪佩琳;麻常莎;;基于二维区间Hash链的RFID安全协议[J];中国科学技术大学学报;2011年07期
2 程秀峰;祝颂;夏立新;;基于分布式的直方图检索方法研究及实现[J];现代图书情报技术;2011年05期
3 向凯全;王盼卿;陈军广;张剑炜;;装备领域中语义桌面上的个人主观本体研究[J];计算机技术与发展;2011年08期
4 史艳莉;路娟;王静;吕刚丽;;PubMed改版升级操作作用研究[J];中国医学装备;2011年08期
5 赵镇;沈滇明;王玉霞;刘月兰;;汉字多功能设备管理系统[J];实验技术与管理;1985年01期
6 刘庆庆;史萍;邵美德;任培明;赵志军;;数字美术馆系统的设计与实现[J];电视技术;2011年09期
7 赵珊;郑清洁;;基于字符串匹配技术的图像检索算法[J];高技术通讯;2010年02期
8 赵珊;高国红;赵倩;;结合边缘信息的图像检索技术[J];小型微型计算机系统;2011年07期
9 丁启伟;戴晨光;赵博;;基于颜色特征利用色矩与BTC法进行影像聚类[J];测绘与空间地理信息;2011年03期
10 赵晔;王昌;;基于非精确图匹配的一种工程图检索方法[J];郑州轻工业学院学报(自然科学版);2011年03期
相关会议论文 前10条
1 孙琦;牛军钰;;基于倒排文件的索引模型综述[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 张刚;孙健;丁国栋;米嘉;王斌;;海量数据的索引与检索系统[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
3 王洪俊;施水才;俞士汶;肖诗斌;;人民日报标注语料的索引方法研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 周水庚;孙敬宇;胡运发;;一种文档聚类新方法[A];第十六届全国数据库学术会议论文集[C];1999年
5 李彩;刘磊;邹玲莹;王晴;;电子索引的制作及使用的工作体会[A];科技编辑出版研究文集(第六集)[C];2001年
6 张侠;;浅谈现阶段图书馆的数字化建设[A];陕西省图书馆学会第五次会员代表大会暨学术研讨会与全国图书馆部室主任工作、学术研讨会论文集[C];2003年
7 辛欣;李涓子;;基于Java语言全文信息检索系统的设计与实现[A];促进企业信息化进程——第十届中国Java技术及应用大会文集[C];2007年
8 王小凤;耿国华;孙霞;张翔;;一个以句为单位的音乐哼唱检索算法[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
9 彭博;朱清新;;三维模型检索的最优搜索策略[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
10 张涛;王成儒;;基于多分辨率差分矩阵的纹理检索[A];第七届青年学术会议论文集[C];2005年
相关重要报纸文章 前8条
1 中国建设银行陕西省分行信息科技处 申飚;存储成本与检索效率的有效平衡[N];计算机世界;2003年
2 万其鸣;Internet 数据库建设方案比较[N];计算机世界;2000年
3 陈慧;强化法院档案资源开发利用提高网络化应用水平[N];江苏经济报;2006年
4 于翔;pureXML破解行业数据管理难题[N];网络世界;2008年
5 院图;电子资源管理与深化服务研讨会召开[N];中国社会科学院院报;2007年
6 中国传媒大学计算机学院 朱立谷邋柳昊 孙志伟 郅斌;CAStor内容存储-管理系统[N];中国计算机报;2007年
7 姜宝欣;沈阳军区档案馆建立功授奖数据库[N];中国档案报;2008年
8 秦峻;沈阳体育学院图书馆启动IPAC[N];中国计算机报;2001年
相关博士学位论文 前5条
1 梁俊杰;大规模图像库的高维索引技术研究[D];华中科技大学;2007年
2 钱剑飞;基于特征符号的程序理解研究[D];浙江大学;2006年
3 王新颖;三维模型检索中基于语义方法的若干问题研究[D];吉林大学;2009年
4 窦郁宏;程序挖掘中构件描述和检索的研究[D];中南大学;2002年
5 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年
相关硕士学位论文 前10条
1 朱广文;信息检索系统的设计与实现[D];哈尔滨工业大学;2007年
2 侯丛;DNA数据存储与比对技术研究[D];西安电子科技大学;2004年
3 王岩;基于本体的数字图书馆的检索方法的研究[D];哈尔滨工程大学;2008年
4 顾燕;基于内容的图像检索方法及其实验系统设计[D];河海大学;2002年
5 程传鹏;基于分类的智能信息检索研究与实现[D];云南师范大学;2005年
6 刘德龙;基于颜色特征的图像检索系统设计与实现[D];华中师范大学;2007年
7 张瑞斌;基于SOA的异构数据源统一检索系统的设计与实现[D];华中师范大学;2008年
8 王齐;一种基于文本节点的XML文档索引和查询方法[D];山西大学;2005年
9 李帅;全文检索在“2008奥运多语言系统”中的应用研究与实现[D];北京工业大学;2009年
10 王艳柏;基于内容的图像检索技术研究[D];长春理工大学;2009年
,本文编号:1573408
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1573408.html