一种分布式环境下的时空数据存储与多维混合索引方法
【文章页数】:96 页
【学位级别】:硕士
【部分图文】:
图2.2?Spark任务运行流程图(怀特,2017)??当Spark运行一个计算任务,整体任务核心的运行层次如图2.2所示
?/??图2.2?Spark任务运行流程图(怀特,2017)??当Spark运行一个计算任务,整体任务核心的运行层次如图2.2所示。其中,??Job代表运行计算的整体任务,Stage作为Job的基本调度单位,Task则是细分后??的多个子任务。??1.
图2.5协处理器模式中指令运行机制(George?L,2013)??列族数据库由于底层架构的分离设计,难以直接对表数据进行初步计算、统计??
周期的变化,每个生命周期状态将与钩子函数进行链接,例如prePut、preScan等??数据库存取存取操作被框架隐式调用,客户端指令操作在协处理器模式中运行机??制如图2.5所示。??客户端?数据分区??Scan?-|?协处理器?1????PreScanOpen?????I???....
图2.6分布式时空数据存储表结构设计??按照如图2.6所示,时空数据的存储目录被划分为元数据表、多属性索引表、??
时空线、面索引??图2.6分布式时空数据存储表结构设计??按照如图2.6所示,时空数据的存储目录被划分为元数据表、多属性索引表、??空间索引表和时空索引表:元数据表存储了整个时空数据表目录的分布结构,记录??了查询索引对应的表名和部分用户自定义参数;属性索引表针对多维属性建立合?....
图2.7时空数据整体存储架构??通过对时空数据存储结构的设计,HBase分别为每种索引表进行分布式存储
表示为线性关系,而检索记录行键或与时间呈对数关系,这使得系统不会因为读写??操作性能而影响系统扩展能力。??查询引擎整体架构如图2.8所示,在HBase的协处理器机制之上,由客户端??和服务端两部分构成。客户端方面,通过池化客户端管理对象,将数据库操作指令??批量传入服务端,解决....
本文编号:3977499
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3977499.html