当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于阈值的快速启动Top-k查询处理算法

发布时间:2018-10-18 15:16
【摘要】:Top-k查询是搜索引擎领域广泛应用的技术之一,该算法从海量数据中返回最符合用户需求的前k个结果,在执行时能避免对大部分无关文档的打分处理。Top-k查询虽然极大提升了查询性能,但其存在的慢启动问题并未得到有效解决。为此,该文首先提取倒排索引的静态Top-k信息,再动态计算针对具体查询词项的初始阈值,在此基础上,结合MaxScore和WAND算法,提出了快速启动的Top-k查询处理算法。实验结果表明,该方法能够有效解决上述问题,具有良好的性能。
[Abstract]:Top-k query is one of the most widely used technologies in search engine field. Top-k query can greatly improve the performance of the query, but the problem of slow start has not been solved effectively. In this paper, the static Top-k information of inverted index is extracted firstly, then the initial threshold for specific query terms is calculated dynamically. Based on this, a fast start Top-k query processing algorithm is proposed by combining MaxScore and WAND algorithms. The experimental results show that this method can solve the above problems effectively and has good performance.
【作者单位】: 西北核技术研究所;国防科学技术大学计算机学院;国防科学技术大学信息中心;西安交通大学电信学院;
【基金】:湖南省自然科学基金(2016JJ2007)
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 辛婷婷;刘国华;;K-匿名隐私保护模型下的Top-k查询[J];计算机科学与探索;2011年08期

2 王新民;大矩阵旋转90°的计算机快速处理算法[J];计算机学报;1981年03期

3 黄琪瑞;;等价语句及其处理算法[J];计算机科学;1979年04期

4 杨涛;李静;潘泉;张艳宁;;一种基于贪心搜索的实时多目标遮挡处理算法[J];自动化学报;2010年03期

5 张刚;王永生;张颖;姜岩;;基于委托模型的孤儿处理算法研究[J];沈阳工业大学学报;2007年02期

6 徐楷亮;;图像特殊效果处理算法初探[J];资源环境与工程;2006年03期

7 邓志才;面向低质指纹的处理算法的研究[J];华南师范大学学报(自然科学版);1997年02期

8 陈优阳;;汉盲翻译中的分词连写处理算法研究[J];网络安全技术与应用;2014年02期

9 田苗苗;景文博;王晓曼;刘树昌;;一种光斑图像加速处理算法研究[J];长春理工大学学报(自然科学版);2014年04期

10 唐桂芬;杨伟锋;黄双临;李炜;;一种高效的累进式空间连接查询处理算法[J];电子学报;2009年02期

相关会议论文 前9条

1 刘小峰;陈传波;刘云生;;移动对象范围最接近邻居查询处理算法研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

2 朱永松;国澄明;肖志涛;;基于TMS320C6701 DSP的图像匹配相关处理算法的研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

3 佟星;王宏志;李建中;高宏;;基于树结构索引的带权值字符串的Top-k查询算法[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

4 张丽;贾焰;邹鹏;;一种数据流上的多Top-k查询资源共享技术研究[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年

5 刘德喜;万常选;刘喜平;;不确定数据库中基于x-tuple的高效Top-k查询处理算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年

6 李栋;史晓东;;对搜索引擎中倒排索引更新策略的研究和改进[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

7 刘小珠;孙莎;曾承;彭智勇;;基于缓存的倒排索引机制研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

8 维尼拉·木沙江;吴俊森;吐尔根·依布拉音;;维吾尔文搜索引擎的倒排索引设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

9 孙宇;刘憬;张宇;刘挺;;基于分词和倒排索引的短文本检索技术的研究与实现[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年

相关博士学位论文 前1条

1 张丁;视频实时处理算法研究[D];浙江大学;2007年

相关硕士学位论文 前10条

1 杨健;基于编辑距离字符串Top-k相似性搜索算法的研究[D];哈尔滨工业大学;2015年

2 孙祥学;基于正交区域Top-K查询的Why-Not问题研究[D];华中科技大学;2016年

3 杨晟;基于RFID数据流的复杂事件处理算法研究[D];广西大学;2015年

4 韩龙;光学触摸实时处理算法研究[D];电子科技大学;2014年

5 许全泉;图像边缘后处理算法研究[D];西安电子科技大学;2007年

6 许卓然;广告搜索中的查询处理算法[D];上海交通大学;2011年

7 刘玉静;针对K-匿名数据的top-k查询问题研究[D];东华大学;2014年

8 黎玲利;XML数据流上的TOP-K关键字查询处理[D];哈尔滨工业大学;2010年

9 王天时;DaVinci平台上的数字媒体处理与传输实验系统[D];北京邮电大学;2012年

10 卢鑫;云环境下海量不确定性数据的Top-k查询技术[D];宁波大学;2013年



本文编号:2279522

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2279522.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1be1e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com