当前位置:主页 > 科技论文 > AI论文 >

人工智能赋能的查询处理与优化新技术研究综述

发布时间:2021-04-01 02:45
  数据查询处理与优化作为数据管理中最具挑战性的问题之一,一直受到广泛关注。传统的查询处理与优化技术在实际使用中需要针对特定的工作负载和数据集进行大量的手动调优,因而已经无法满足现代数据库系统的发展需求。受人工智能(AI)成功应用于多领域研究的启发,近期人工智能赋能的查询处理与优化新技术相继被提出并取得了一定的研究成果。针对这些研究工作,首先给出了人工智能赋能的查询处理与优化技术的主要任务,分析了与传统人工智能任务的区别。其次梳理了该领域的主要研究进展,并总结了主要优势与应用瓶颈。接着讨论了当前所面临的主要技术挑战。最后对该领域的未来发展进行了展望。 

【文章来源】:计算机科学与探索. 2020,14(07)北大核心CSCD

【文章页数】:23 页

【部分图文】:

人工智能赋能的查询处理与优化新技术研究综述


循环神经网络示意图

示意图,示意图,插值,辅助模型


IFB(interpolation-friendly B-trees)树索引由Hadian等人于文献[17]中提出。如图6(b)所示,与只对叶子节点查询加速的A树相比,IFB树索引利用线性插值方法建立辅助模型,在查询的不同阶段改进经典索引。Hadian等人认为B树查询中,节点内部搜索占用了相当大的时间开销。针对这一缺陷,作者利用辅助模型直接预测查询节点位于下一层节点中的位置,避免了内部搜索,查询过程如图6(a)所示。由于辅助模型并不改变B树的结构,因此IFB树与B树具有一致的理论性能保证。但由于插值算法对于不同的节点的误差不同,若存储多个插值将难以保证B树的效率与开销。为此,IFB树设置最大错误阈值Δ。建树时,若节点的插值位置的错误阈值小于Δ,则将节点标记为插值友好,使用插值算法查询,对于非插值友好节点,则使用传统方法进行查询。3.1.2 基于深度模型的学习索引

过滤器图,过滤器,索引


对于文献[18]中学习Bloom过滤器,Mitzenmacher[19]提出了简单的改进方法,提高过滤精度,增强学习Bloom过滤器的鲁棒性。作者将学习Bloom过滤器夹在两个小规模Bloom过滤器中,如图8所示。预过滤器首先过滤输入中假阳性的数据,备份过滤器对学习索引中生成的负例进行筛选,获得假阴性的数据。基于学习索引的启发,Oosterhuis等人[20]挖掘机器学习用于倒排索引优化的潜力,研究学习索引如何支持倒排索引中常见的基于布尔交集的查询。作者将每个文档作为一个单独的属性集合,使用学习Bloom过滤器,判断文档是否包含某属性。由于这种方法的查询成本与集合中文档的数量成正比,因此作者提出基于两层检索的方法与基于块的方法缩小查询空间,降低查询成本。实验证明,学习索引与当前索引相比提供了空间优势,有巨大的研究潜力。

【参考文献】:
期刊论文
[1]轩辕:AI原生数据库系统[J]. 李国良,周煊赫.  软件学报. 2020(03)
[2]面向关系数据库的智能索引调优方法[J]. 邱涛,王斌,舒昭维,赵智博,宋子文,钟延辉.  软件学报. 2020(03)
[3]人工智能赋能的数据管理技术研究[J]. 孙路明,张少敏,姬涛,李翠平,陈红.  软件学报. 2020(03)
[4]机器学习化数据库系统研究综述[J]. 孟小峰,马超红,杨晨.  计算机研究与发展. 2019(09)
[5]一个端到端的基于深度学习的查询优化引擎[J]. 孙佶,李国良.  赤峰学院学报(自然科学版). 2019(01)
[6]数据库物理自调优研究技术综述[J]. 曹巍.  计算机应用研究. 2012(05)
[7]不确定性数据管理技术研究综述[J]. 周傲英,金澈清,王国仁,李建中.  计算机学报. 2009(01)



本文编号:3112545

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/rengongzhinen/3112545.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户44ffc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com