实时ETL弹性调度机制研究
发布时间:2025-03-18 06:53
在如今快速竞争的商业环境中,用户更倾向于使用最新的数据完成商业分析,因此实时ETL(Extract-Transform-Load)被提出以解决实时分析的需求。如今,实时ETL相关的研究层出不穷,但提出的解决方案中都没有考虑到数据的动态性。在很多实际场景中,数据源的数据生产速度随着时间波动且波动区间较广。在实时ETL系统中,ETL过程为常驻应用程序,如果能够在ETL过程运行时弹性调整ETL过程的资源,则有利于提高系统整体的资源利用率。因此,本文深入探讨了数据波动较大的场景下,关于实时ETL弹性调度机制的研究。本文主要工作分为两部分:一是单个用户的多个ETL过程弹性调度机制的研究;二是单个ETL过程弹性调度机制的研究。在单个用户的多个ETL过程弹性调度方面,本文首先构建了基于历史数据的时间序列预测模型用于预测ETL过程未来的数据生产速度;然后,根据各个ETL过程提交的资源清单,提出基于紧迫度的动态调度算法,用来调整单个用户多个ETL过程的资源。在单个ETL过程弹性调度方面,本文首先根据各个服务器负载情况,提出贪婪负载均衡算法,保证单个ETL过程调度资源时各个服务器负载能够均衡;然后,提出基于...
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
本文编号:4036174
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图 2.1 ETL 发展历程1
武汉科技大学硕士学位论文7第2章基本理论与相关知识2.1实时ETL概念如今,快速的商业竞争导致消费者需要更快的交易处理、个性化的体验以及具有最新数据访问的自助服务,数据集成方法要求更高效的、更低延迟的收集数据并分发给需要的客户或程序。因此,越来越多的数据集成将数据迁移的解决方案从....
本文编号:4036174
本文链接:https://www.wllwen.com/jingjilunwen/xmjj/4036174.html
上一篇:亲组织非伦理行为的私利风险及作用机制研究
下一篇:没有了
下一篇:没有了