一种增量倒排索引结构的设计与实现
发布时间:2018-05-08 13:58
本文选题:主题式搜索引擎 + 增量倒排索引 ; 参考:《吉林大学学报(理学版)》2007年06期
【摘要】:针对主题爬行器获取网页更新速度快的特点,提出一种用于网络搜索引擎的增量索引结构.在建立倒排索引时,每个词项的记录表以链接块的形式存放于倒排索引文件中,每次新分配的块大小递增.该索引结构解决了倒排索引连续存储所带来的难以更新问题.实验结果表明,与支持实时更新的传统链表式存储方式相比,这种索引结构能提供更高效的检索,采用以空间换时间的方法有效地提高了索引的更新效率.
[Abstract]:An incremental index structure for web search engines is proposed in this paper. When the inverted index is built, the record table of each word item is stored in the inverted index file in the form of link block, and the size of each newly allocated block is incremented. The index structure solves the problem that the inverted index is difficult to update in continuous storage. The experimental results show that the index structure can provide more efficient retrieval than the traditional linked list storage method which supports real-time update and the updating efficiency of the index is improved effectively by using the method of space-for-time exchange.
【作者单位】: 吉林大学计算机科学与技术学院 吉林大学符号计算与知识工程教育部重点实验室
【基金】:国家自然科学基金(批准号:60373099) 教育部“符号计算与知识工程”重点实验室项目基金(批准号:93K-17) 吉林省科技发展计划项目基金(批准号:20070533)
【分类号】:TP391.3
,
本文编号:1861681
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1861681.html