时间序列聚类中U-shapelets提取方法的研究
发布时间:2020-12-21 18:37
时间序列数据广泛存在于生活的各个方面,它记录了事物在每个给定时间间隔内的观测值,具有数据维度高、数据量大的特点。时间序列聚类作为数据挖掘领域的一个重要研究分支,受到人们的广泛关注。传统的研究方法大多直接对整个时间序列进行聚类分析,然而时间序列中存在的噪音等无关数据会影响聚类结果的准确性。最近,一种基于u-shapelets的时间序列聚类方法被提出,该方法利用局部形状特征来区分序列之间的差异,不仅聚类精度高,对聚类结果也有很好的解释性。虽然基于u-shapelets的时间序列聚类方法已经取得一定的成果,但仍存在一些问题。主要体现在三个方面:其一,提取u-shapelets的过程非常耗时,尤其是在一些大数据集上;其二,为了加速u-shapelets的提取而忽略其质量,在一定程度上降低了聚类结果的准确性;其三,原始的u-shapelets质量度量方式不够准确,会影响u-shapelets的辨别性。本文围绕以上问题主要对u-shapelets的提取过程进行研究,其主要内容如下:(1)本文提出一种随机局部搜索u-shapelets的算法(Random Local Search Algorithm...
【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
某股票在2012-2016年的交易数量
华东师范大学硕士学位论文 第一章 绪论这与人们直观上的理解为什么有些时间序列能够被分为同一类簇是一致的。U-shapele是利用时间序列的局部形状特征进行聚类分析的,这种方法可以有效缓解时间序列数据维度高以及存在噪音的问题,也可以用于不等长时间序列的聚类,最重要的是聚类结果具有准确性高、可解释性强的特点。因此,基于 u-shapelets 的时间序列聚类具有广泛的研究前景。
一个时间序列是一组连续的实值型数据值,通常是在相同时间间隔内,给定采样率,对某个过程进行观测得到的一组数据[34]。定义 2.1 时间序列。时间序列 是一个实值序列,可以表示为 ,其中 是时间序列 的长度。定义 2.2 时间序列数据集。时间序列数据集 是 个时间序列 的集合。本文研究的重点是时间序列的子序列,所以接下来对时间序列的子序列进行定义。定义 2.3 子序列。一个时间序列 的子序列 是从位置 开始长度为 的连续的子片段,其中 ≤ ≤ , ≤ ≤ 。值得注意的是,子序列中的数据点是连续的,每个子序列可以看作是时间序列的一个局部形状特征。子序列可以通过采用滑动窗口算法(Sliding Window Algorithm)[29]在长序列上进行滑动得到。如图 2.1 所示,给定窗口大小,在时间序列上滑动,每个滑动点产生一个与滑动窗口长度相等的子序列。
本文编号:2930292
【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
某股票在2012-2016年的交易数量
华东师范大学硕士学位论文 第一章 绪论这与人们直观上的理解为什么有些时间序列能够被分为同一类簇是一致的。U-shapele是利用时间序列的局部形状特征进行聚类分析的,这种方法可以有效缓解时间序列数据维度高以及存在噪音的问题,也可以用于不等长时间序列的聚类,最重要的是聚类结果具有准确性高、可解释性强的特点。因此,基于 u-shapelets 的时间序列聚类具有广泛的研究前景。
一个时间序列是一组连续的实值型数据值,通常是在相同时间间隔内,给定采样率,对某个过程进行观测得到的一组数据[34]。定义 2.1 时间序列。时间序列 是一个实值序列,可以表示为 ,其中 是时间序列 的长度。定义 2.2 时间序列数据集。时间序列数据集 是 个时间序列 的集合。本文研究的重点是时间序列的子序列,所以接下来对时间序列的子序列进行定义。定义 2.3 子序列。一个时间序列 的子序列 是从位置 开始长度为 的连续的子片段,其中 ≤ ≤ , ≤ ≤ 。值得注意的是,子序列中的数据点是连续的,每个子序列可以看作是时间序列的一个局部形状特征。子序列可以通过采用滑动窗口算法(Sliding Window Algorithm)[29]在长序列上进行滑动得到。如图 2.1 所示,给定窗口大小,在时间序列上滑动,每个滑动点产生一个与滑动窗口长度相等的子序列。
本文编号:2930292
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2930292.html