当前位置:主页 > 科技论文 > 软件论文 >

关系数据库支持的不确定时间序列存储与优化方法研究

发布时间:2021-01-19 00:13
  时间序列作为一种常见的数据表现形式,广泛存在于现实世界的许多应用领域。人类通过对观测和采集到的时间序列数据加以处理,可以解决决策和预测等诸多方面的问题,尤其对于国民经济宏观控制、气象预报、地震前兆预报等现实应用具有重要意义。由于不确定性数据的普遍存在,当前基于对确定性时间序列数据的存储和管理理论已经无法适用于实际需要。首先,传统时序数据库普遍采用在分布式环境下的列式存储,以这种形式存储不确定时间序列数据会造成存储资源的浪费。其次,相比于精确数据,不确定数据中一个时间点上对应多个数据,使用传统时序数据库存储容易造成数据的混乱。目前,针对不确定时间序列数据的存储少有研究成果发表。本文致力于对不确定时间序列在关系数据库中的存储方法进行研究,试图在克服传统数据库缺陷的基础上,寻找一种简单高效的数据存储方式,实现不确定时间序列数据的有效存储。论文的主要工作包括两点:1.提出一种基于关系数据库的不确定时间序列存储方法。首先,利用传统结构化表示语言对非结构化不确定时间序列进行描述,并分析其存储到关系数据库所带来的问题。其次,通过分析这些问题并结合传统时序数据库的存储特点,提出了针对不确定时序存储框架... 

【文章来源】:南京航空航天大学江苏省 211工程院校

【文章页数】:79 页

【学位级别】:硕士

【部分图文】:

关系数据库支持的不确定时间序列存储与优化方法研究


图01020304050195519601965197019751980198519901995200020052010(b)不同类型鲶鱼数量同时序走势

分析图,分析图


图 1.3 存储分析图确定的时序数据选择不同的存储方法时,已经有许多文献对此展开讨论。Google 公司提出了三篇在大数据领域经典的论文(GFS/Bigtable/MapReduce[24]),这几篇文章的出掀起了互联网分布式存储的热潮。存储体系的支撑体系用 GFS[22]来存储数据文件和日按 SSTable 文件格式来存储数据,用 Chubby 管理元数据,整个存储体系改变了传统的,采用在尾部追加数据的方式去替代原覆盖方式。Bigtable[23]是一个稀疏的、分布式的、多维有序 Map,这张 Map 针对行键、列名和时间戳都建立了索引,它是以键值对对为问方式,奠定了近年来列式存储的基础。xDB[25]是一款运用 Go 语言写的时间序列数据库,主要依赖于 LSM tree[26],而该树是ogle 的 Bigtable 架构,数据则是以键值对的方式存储的。该时序数据库存储结构实现了以及时间戳 2 个维度的有序存取,并通过压缩数据来降低 I/O 开销,查询一系列值时,。nTSDB[27]是一种基于 HBase[23,28]的分布式,可伸缩的时间序列数据库。HBase 中的基本单元,每个单元格可以有多个版本的数据。在物理存储方面上,每个列簇都持续的存

示意图,时间序,离散型,不确定


南京航空航天大学全日制专业学位硕士学位论文于时间戳上的多个可能表示,每个值对应于可能发生的概率,并且对应于每个时获取值的概率之和为 1。图 2.2 显示了一个离散的时间序列,其中每个点都有相同在进行存储时,不对原始数据进行规约,将该条序列全部进行存储,在进行相似理时,考虑到每个值发生的概率,并以概率的形式进行结果分析。这样应该以不方式进行有效处理,而不是选取每个可能值,使得计算量成倍增大,降低处理效


本文编号:2985940

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2985940.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户13cf5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com