时间序列数据相似性与聚合top-k查询算法研究与应用
本文关键词:时间序列数据相似性与聚合top-k查询算法研究与应用,由笔耕文化传播整理发布。
【摘要】:时间序列数据普遍存在于生活中各个方面的应用领域中。一般的,时间序列数据是一个包含时间戳及数值的有序序列。近年来随着传感网络等技术的发展,在金融、医疗、交通、环境监测、数字文物保护等领域高速产生并累积了大量的时间序列数据。如何高效的对海量时间序列数据进行挖掘和管理成为目前新的挑战。本文针对海量时间序列数据查询和管理方面存在的若干问题,研究了时间序列数据的相似性问题、聚合top-k查询问题并实现了面向文物保护的时间序列数据的管理原型系统等。本文的具体工作如下:研究了时间序列数据相似性问题,提出了基于形状信息的相似性度量方法——趋势距离相似性度量,解决了时间序列数据中的多种形变及多尺度相似性定义导致的难以准确判断数据间的相似度的问题。本文首先对目前已有的时间序列数据相似性度量方法进行了总结和分析,随后提出了趋势距离相似性度量方法并在多个数据集上进行了实验。研究了时间序列数据聚合top-k查询问题,提出了I/0高效的查询算法,解决了海量数据集上查询速度慢的问题。目前已有的时间序列数据聚合top-k查询算法的速度瓶颈在于查询过程中访问磁盘次数过多。为解决此问题,本文提出的算法引入新的索引结构和剪枝策略,实验结果表明该算法能有效降低查询过程中访问磁盘的次数,提高查询速度。设计并实现了面向文物保护的时间序列数据的管理原型系统。本系统包括时间序列数据流分析组件、历史时间序列数据存储管理组件及两者之间的连接,加强了文物监测现场的数据分析支持,更符合面向文物保护的时间序列数据管理需求。
【关键词】:时间序列数据 相似性 聚合top-k 原型系统
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要4-5
- Abstract5-11
- 第1章 绪论11-20
- 1.1 研究背景11-12
- 1.2 研究现状12-16
- 1.2.1 时间序列数据挖掘12-15
- 1.2.2 面向文物保护的时间序列数据存储管理15-16
- 1.3 面临的主要问题16-17
- 1.4 本文的研究内容17-18
- 1.5 本文的组织结构18-20
- 第2章 相关技术20-31
- 2.1 时间序列数据相似性度量20-23
- 2.2 时间序列数据聚合top-k查询23-26
- 2.2.1 I/O高效算法模型23-24
- 2.2.2 移动小波树索引24-26
- 2.3 时间序列数据存储系统概述26-30
- 2.3.1 时间序列数据库26-28
- 2.3.2 Elasticsearch概述28-30
- 2.4 本章小结30-31
- 第3章 基于形状信息的相似性度量方法31-48
- 3.1 时间序列相似性问题分析31-33
- 3.2 问题定义及算法动机33-35
- 3.2.1 问题定义33-34
- 3.2.2 算法动机34-35
- 3.3 基于形状信息的相似性度量35-41
- 3.3.1 时间序列数据预处理36
- 3.3.2 形状信息提取模型36-40
- 3.3.3 趋势距离函数40-41
- 3.4 实验结果41-47
- 3.5 本章小结47-48
- 第4章 I/O高效的时间序列数据聚合top-k查询48-72
- 4.1 时间序列数据聚合top-k问题分析48-49
- 4.2 问题定义及相关说明49-50
- 4.3 I/O高效的聚合top-k查询算法50-67
- 4.4 实验结果67-71
- 4.5 本章小结71-72
- 第5章 面向文物保护的时间序列数据管理原型系统72-81
- 5.1 建设需求72-73
- 5.2 系统建设目标73
- 5.3 系统设计方案73-77
- 5.3.1 技术路线73-74
- 5.3.2 关键功能模块设计74-77
- 5.4 系统实现77-80
- 5.5 本章小结80-81
- 第6章 总结与展望81-84
- 6.1 总结81-82
- 6.2 展望82-84
- 参考文献84-88
- 攻读硕士学位期间主要工作88-89
- 致谢89
【相似文献】
中国期刊全文数据库 前10条
1 张丽红;;查询算法的优化设计[J];职大学报;2009年02期
2 陈富强;奚建清;;商覆盖立方体中下掘与上卷操作的查询算法设计[J];信息技术;2011年04期
3 李英女,郑国雄;铁路客运信息查询算法[J];铁路计算机应用;2000年02期
4 徐红波;郝忠孝;;一种基于Z曲线近似k-最近对查询算法[J];计算机研究与发展;2008年02期
5 刘平;陈旭灿;李思昆;;嵌入式空间数据库综合查询算法[J];计算机工程;2008年17期
6 赵智慧;;基于对象方向方位的连续方向查询算法[J];齐齐哈尔大学学报(自然科学版);2010年04期
7 徐红波;韩启龙;潘海为;;空间数据库最优位置查询算法研究[J];计算机工程与应用;2011年18期
8 杜左强;基于对象的空间数据库的方位查询算法[J];信息技术;2004年07期
9 徐红波;郝忠孝;;一种采用Z曲线高维空间范围查询算法[J];小型微型计算机系统;2009年10期
10 高静波,李新友,唐泽圣,周晓辉;半动态矩形交查询算法[J];软件学报;1997年08期
中国重要会议论文全文数据库 前10条
1 洪润秋;金文;陈钢;王能斌;;迭代查询子查询算法的研究[A];第十一届全国数据库学术会议论文集[C];1993年
2 常珂;刘辰;杨正球;;基于树状结构的查询算法的设计与实现[A];中国通信学会第六届学术年会论文集(中)[C];2009年
3 孙焕良;刘江秀;许景科;;基于楔的时间序列流双向封装过滤查询算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
4 李江波;周强;陈祖舜;;汉语词典快速查询算法研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 董科;王国仁;宁博;毛克明;赵相国;;基于压缩叶子流的XML Twig查询[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
6 刘旭辉;冯建华;洪亲;;一种支持更新的图可达性查询算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
7 刘怡;郝云飞;;一种有效的复调音乐查询算法[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
8 黄海;侯颖;朱圣平;;一种多维向量并行查询算法[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
9 徐忠华;张剡;陈玲;柏文阳;;基于星型模型的轮廓连接查询算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
10 陈冬霞;吉根林;武志峰;;一种基于签名的XML查询算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国博士学位论文全文数据库 前7条
1 徐红波;基于空间填充曲线高维空间查询算法研究[D];哈尔滨理工大学;2010年
2 刘润涛;基于序的空间数据索引及查询算法研究[D];哈尔滨理工大学;2009年
3 季长清;云计算环境下的大规模空间近邻查询算法研究[D];大连海事大学;2014年
4 邹磊;图数据库中的子图查询算法研究[D];华中科技大学;2009年
5 谢鲲;布鲁姆过滤器查询算法及其应用研究[D];湖南大学;2007年
6 刘艳;基于主存的高维空间连接及查询算法研究[D];哈尔滨理工大学;2011年
7 田小梅;多布鲁姆过滤器查询算法及其应用研究[D];湖南大学;2013年
中国硕士学位论文全文数据库 前10条
1 黄海龙;大规模图的图查询算法研究[D];燕山大学;2015年
2 李青;分布式计算环境下海量RDF数据的skyline查询研究[D];郑州大学;2015年
3 邓育;空间近似关键字反远邻查询方法研究[D];安徽工业大学;2015年
4 于世龙;信息物理融合系统资源索引与查询技术研究[D];国防科学技术大学;2013年
5 郭岩;实时数据流相似性查询算法的研究[D];华北电力大学;2015年
6 钟丽娟;时间序列数据相似性与聚合top-k查询算法研究与应用[D];浙江大学;2016年
7 龚翱;改进的城市公交查询算法研究[D];湖南大学;2008年
8 郭聪敏;图集的子图查询算法研究[D];燕山大学;2012年
9 夏伯男;基于权值设定策略的公交查询模型及实现研究[D];大连工业大学;2010年
10 黄荣跃;连续K-支配SKYLINE查询算法研究[D];苏州大学;2012年
本文关键词:时间序列数据相似性与聚合top-k查询算法研究与应用,由笔耕文化传播整理发布。
,本文编号:352804
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/352804.html