基于稀疏逆协方差的多变量时间序列聚类研究
发布时间:2021-11-08 07:09
时间序列数据的挖掘是一个重要且成熟的研究主题,解决了很多现实问题。多变量时间序列(MTS)在众多领域应用广泛,如何对MTS准确高效地进行聚类已经成为一个热门的研究课题。相比较于单变量时间序列(UTS),因为高维度以及各变量之间复杂的依赖关系,并且适用于UTS的传统聚类方法也不能直接应用于MTS,使得MTS的研究具有更大的挑战性。同时,很多应用会产生大量事先未分割的时间序列数据。基于以上探索,本文对多变量时间序列聚类展开了研究,主要研究工作如下:(1)由于对于时间序列的研究大多集中在单变量时间序列上,且传统的基于距离的方法很难适用于多变量时间序列,我们提出了一种全新的基于模型的方法—基于稀疏逆协方差的Kullback-Leibler散度多变量时间序列聚类方法(KLDSICC)。该方法使用多变量高斯模型作为数据表示和簇原型,Kullback-Leibler散度作为距离度量。该方法包含两个阶段,首先将每个MTS转换成多变量高斯模型,并结合图形套索得到关键参数稀疏逆协方差;然后受到传统聚类方法K-Means原理启发,再利用多变量高斯模型之间的KL散度进行簇分配。与传统方法相比,KLD-SICC...
【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
距离度量的分类
评价方法的分类
本文的方法总体框架图如图3.1。主要分为两个阶段,首先是将每个MTS转换成多变量高斯模型,并结合图形套索得到关键模型参数稀疏逆协方差。然后,受传统聚类方法K-Means的启发,使用多变量高斯模型作为聚类的原型,基于KL散度设计了一种新的MTS距离度量方法来进行簇分配过程。簇分配完成之后,为了更新簇参数,我们将每个集群内的所有MTS合并,并再次结合图形套索将合并后的MTS转换成多变量高斯模型,将作为新的聚类中心。我们的方法类似于K-Means迭代簇分配和簇原型参数更新的收敛过程,直到每个簇的成员不再发生变化为止。3.3.1 聚类方法描述
【参考文献】:
期刊论文
[1]基于时间序列转录组筛选谷氨酸棒杆菌内源高效组成型启动子[J]. 王迎春,刘娇,倪晓蒙,雷宇,郑平,刁爱坡. 生物工程学报. 2018(11)
[2]基于时间序列模型残差的中国东部地区空气质量指数(AQI)空间自相关特征分析[J]. 贺冉冉,朱兰保,周开胜. 环境科学学报. 2017(07)
[3]短期风速时间序列混沌特性分析及预测[J]. 田中大,李树江,王艳红,高宪文. 物理学报. 2015(03)
[4]中国金融发展与全要素生产率——基于时间序列的经验证据[J]. 姚耀军. 数量经济技术经济研究. 2010(03)
本文编号:3483250
【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
距离度量的分类
评价方法的分类
本文的方法总体框架图如图3.1。主要分为两个阶段,首先是将每个MTS转换成多变量高斯模型,并结合图形套索得到关键模型参数稀疏逆协方差。然后,受传统聚类方法K-Means的启发,使用多变量高斯模型作为聚类的原型,基于KL散度设计了一种新的MTS距离度量方法来进行簇分配过程。簇分配完成之后,为了更新簇参数,我们将每个集群内的所有MTS合并,并再次结合图形套索将合并后的MTS转换成多变量高斯模型,将作为新的聚类中心。我们的方法类似于K-Means迭代簇分配和簇原型参数更新的收敛过程,直到每个簇的成员不再发生变化为止。3.3.1 聚类方法描述
【参考文献】:
期刊论文
[1]基于时间序列转录组筛选谷氨酸棒杆菌内源高效组成型启动子[J]. 王迎春,刘娇,倪晓蒙,雷宇,郑平,刁爱坡. 生物工程学报. 2018(11)
[2]基于时间序列模型残差的中国东部地区空气质量指数(AQI)空间自相关特征分析[J]. 贺冉冉,朱兰保,周开胜. 环境科学学报. 2017(07)
[3]短期风速时间序列混沌特性分析及预测[J]. 田中大,李树江,王艳红,高宪文. 物理学报. 2015(03)
[4]中国金融发展与全要素生产率——基于时间序列的经验证据[J]. 姚耀军. 数量经济技术经济研究. 2010(03)
本文编号:3483250
本文链接:https://www.wllwen.com/kejilunwen/yysx/3483250.html