一种基于时间敏感度的实时搜索模型研究
发布时间:2017-10-05 09:08
本文关键词:一种基于时间敏感度的实时搜索模型研究
【摘要】:随着新的内容通过各种方式来获得,实时搜索引擎成为非常具有挑战性的工作。搜索引擎应具有高效的索引机制,同时也要确保索引的新鲜度和覆盖的范围。这样就要求搜索引擎支持更快的索引更新。延迟索引的检索延迟和索引延迟对新鲜度发挥了重要作用。前者是基于时间获取内容,而后者是根据发布时间让索引获取更新的内容。提出了一种框架,优化索引延迟和索引覆盖,并对实验结果进行了分析,证明该框架能够实现索引的新鲜和覆盖,从而支持更快地对搜索查询的处理。
【作者单位】: 广东女子职业技术学院应用外语系;湖北工业大学计算机学院;
【关键词】: 搜索引擎 索引新鲜 索引覆盖 信息检索
【分类号】:TP391.3
【正文快照】: 引言实时搜索引擎不断地搜索来自Web内容的数据流,数据流是指一组在网站上发布用的命令文件,并且是源源不断地到来。目前获得来自数据流的内容有两种方式:即Atom(自动文摘技术)提要和通过基于分销协议的RSS(真正简易聚合)推送和轮询来获取通知。这两项技术在图书情报上应用无,
本文编号:975927
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/975927.html