一种面向域的高效倒排索引结构及实时更新
本文选题:倒排索引 切入点:增量更新 出处:《四川大学学报(自然科学版)》2011年02期 论文类型:期刊论文
【摘要】:倒排索引是搜索引擎的核心组成部分,对搜索的效率与质量有着较大的影响.在一些主题搜索引擎中,关键词被划分为多个域以提高检索质量,针对这种特点,本文提出了一种新的面向域的高效倒排索引结构,以及实时更新倒排索引的算法.实验结果表明,在每个域内索引词项个数接近词典大小的情况卞,本文提出的倒排索引结构可以有效地提高搜索引擎的检索效率.
[Abstract]:Inverted index is the core part of search engine, which has great influence on the efficiency and quality of search. In some subject search engines, keywords are divided into multiple domains to improve retrieval quality. In this paper, a new domain oriented inverted index structure and an algorithm for updating inverted index in real time are proposed. The experimental results show that the number of words in each domain is close to the size of the dictionary. The inverted index structure proposed in this paper can effectively improve the search efficiency of search engines.
【作者单位】: 四川大学锦江学院;
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 吴恒山,刘兴宇,左琼;一种基于可扩展散列表的倒排索引更新策略[J];计算机工程;2004年08期
2 林怀忠,周波,郑增威,陈纯;移动数据库的视图增量更新算法[J];计算机集成制造系统-CIMS;2004年03期
3 段琢华;一种高效的关联规则增量更新算法[J];机电工程技术;2004年02期
4 白洪涛,孙吉贵,莫旭,杨凤杰;一个专用ETL程序的实现[J];计算机应用;2004年02期
5 王宏宇;;基于Native-XML数据库倒排索引算法研究[J];情报科学;2006年07期
6 顾颀;胡孔法;陈];唐晓丽;刘海东;;基于维层次的语义Cube存储与增量更新技术研究[J];计算机应用研究;2007年06期
7 苏潭英;郭宪勇;金鑫;;一种基于Lucene的中文全文检索系统[J];计算机工程;2007年23期
8 孙宝友;姜合;赵园园;;关联规则的增量更新算法研究[J];计算机与信息技术;2008年03期
9 黄少林;王华;张玉红;蒋一峰;;基于Lucene的索引系统的设计与实现[J];现代情报;2009年07期
10 刘妍;韩秀峰;;导航电子地图增量更新数据模型研究[J];吉林建筑工程学院学报;2010年04期
相关会议论文 前10条
1 刘小珠;孙莎;曾承;彭智勇;;基于缓存的倒排索引机制研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 李栋;史晓东;;对搜索引擎中倒排索引更新策略的研究和改进[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
3 夏燕;邓绪斌;李岱;朱扬勇;;生物数据仓库半结构化增量更新技术的研究与实现[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
4 董祥千;左志宏;刘强国;;Lucene倒排索引文件的实现与优化[A];四川省通信学会2006年学术年会论文集(二)[C];2006年
5 温磊;李敏强;;基于有向项集图的频繁项集增量更新挖掘算法[A];2004中国控制与决策学术年会论文集[C];2004年
6 辛欣;李涓子;;基于Java语言全文信息检索系统的设计与实现[A];促进企业信息化进程——第十届中国Java技术及应用大会文集[C];2007年
7 罗晓燕;袁燕岩;郭金丽;张红;;北京市数字线划图数据库增量更新技术的应用研究[A];数字测绘与GIS技术应用研讨交流会论文集[C];2008年
8 维尼拉·木沙江;吴俊森;吐尔根·依布拉音;;维吾尔文搜索引擎的倒排索引设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 林艳;刘万增;陈军;;GIS数据库增量更新的模型研究[A];中国测绘学会九届四次理事会暨2008年学术年会论文集[C];2008年
10 孙宇;刘憬;张宇;刘挺;;基于分词和倒排索引的短文本检索技术的研究与实现[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
相关重要报纸文章 前5条
1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
2 特约作者 李岩;iOS5带来什么[N];电脑报;2011年
3 本报通讯员 戴韫卓 李庭常;与时间赛跑[N];中国国土资源报;2011年
4 记者 王瑜婷;导航电子地图现势性将提高一倍[N];中国测绘报;2009年
5 赛迪顾问半导体产业研究中心咨询师 徐鹏;国内导航电子地图市场将走向集中[N];中国计算机报;2009年
相关博士学位论文 前10条
1 王钊;车辆导航电子地图的自增量更新[D];清华大学;2012年
2 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
3 汪健;支持增量更新的多模式城市交通网络时空数据模型研究[D];吉林大学;2009年
4 周晓光;基于拓扑关系的地籍数据库增量更新方法研究[D];中南大学;2005年
5 于宝琴;成套电器企业异构数据整合及其物流系统的研究[D];天津大学;2006年
6 李文海;基于粗集的关系型联机分析优化技术研究[D];华中科技大学;2007年
7 钱新林;面向自发地理信息的空间数据表达与管理方法研究[D];武汉大学;2011年
8 吴炜;密文全文检索系统中的索引机制研究[D];华中科技大学;2009年
9 金雪云;基于XQuery的增量计算程序自动生成技术研究[D];北京工业大学;2012年
10 周明;基于数据挖掘的制造业采购DSS理论及方法研究[D];天津大学;2009年
相关硕士学位论文 前10条
1 王勇;基于定时任务和增量更新技术的数据实时更新方法的研究[D];北京邮电大学;2010年
2 黄文嘉;基于变化影像块的遥感数据增量更新方法研究[D];中南大学;2011年
3 董长春;基于Hadoop的倒排索引技术的研究[D];辽宁大学;2011年
4 王春华;增量更新关联规则挖掘方法的研究[D];哈尔滨工程大学;2012年
5 潘胜一;基于倒排索引的压缩算法性能研究[D];杭州电子科技大学;2009年
6 陈雪帆;基于固态硬盘的倒排索引构建与维护策略研究[D];华中科技大学;2012年
7 薛煜阳;农业搜索引擎倒排索引缓冲机制研究[D];新疆农业大学;2011年
8 屈磊;动态全文索引系统关键技术研究[D];哈尔滨工业大学;2009年
9 刘春艳;关联规则及关联规则增量更新研究[D];四川师范大学;2011年
10 吴俊森;维哈柯多语种搜索引擎倒排索引模块的实现[D];新疆大学;2007年
,本文编号:1628379
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1628379.html