当前位置:主页 > 科技论文 > 数学论文 >

模型空间中的时间序列分类算法及其在不平衡数据上的应用

发布时间:2020-11-22 09:58
   时间序列是对动态系统随时间顺序采集到的有序观测值集合,通常具有高维、异质和含噪声等特点。观测值之间在时序上可能存在或长或短的依赖关系,构成特定的时序动态模式,因而不同于一般的向量数据。对于时间序列这样的结构化对象,关键研究问题是(1)如何获得反映动态模式的精简低维表示,使得学习器能够利用具有动态行为的序列数据,(2)如何定义具有判别性的距离度量方式,使得类内距离小而类间距离大。本文提出基于模型空间的时间序列分类方法。该方法为每个时间序列学习函数模型,在函数模型集合张成的空间(称为模型空间)中度量原始数据的距离。最后,分类算法在该空间中进行。本文对模型空间的生成机制及其在不平衡序列数据分类中的应用进行了研究,提出对模型的表示性,分类性和模型复杂度项进行优化生成模型空间,并分析了多个目标之间的关系。考虑到多目标之间的不一致带来的优化困难,采用多目标非支配排序演化算法对三个目标同时进行优化。针对分布不平衡的时间序列分类,基于核学习提出一种核特征空间中的过采样学习算法。本文的主要贡献如下:1.本文提出一种多目标学习方法,同时为时间序列优化精简函数表示、距离度量和模型复杂度。和优化单个目标得到的模型相比,本文方法学习得到的模型表示具有更好的时间序列分类准确度和预测精度。2.作为缓解不平衡分类问题的重要方法之一,传统的过采样方法不能适用于具有时序依赖关系、多变量和变长特性的时间序列。本文提出基于核学习获得时间序列模型的非线性距离度量,并在中心化核特征空间进行过采样的方法。原来线性不可分的数据在非线性的核特征空间中更有可能线性可分,满足了在已有过采样方法中常常被忽视的线性可分假设,所以产生的样本点更符合小类数据的分布,不容易过拟合。3.在标准数据集和人造数据集上的时间序列分类实验表明,本文提出的方法具有更好的分类准确度和鲁棒性。
【学位单位】:中国科学技术大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:O211.61
【部分图文】:

示意图,路径,示意图,时间序列


图2.1?DTW搜索最优比对路径示意图??得累积逐点距离最小化的最佳对齐方式[27],并会返回最佳对齐下的距离值衡量??两个序列之间相似性。图2.1显示了两条时间序列的对齐过程,图中显示了时间??点级别的距离矩阵和最优比对路径,左侧和下侧显示了两条时间序列。??具体地,令L??e?表示时间序列Q和C每个时间点之间的距离构成的??矩阵。DTW算法从矩阵D的位置[1,1]移动到位置[LQ,Ld,得到对应的索引序??列A和B,其具有相同的长度〇?max{LQ,心丨,使得的累计距离g=1?被??最小化。通过这种方式,序列Q的点A⑷与序列C的点S⑷匹配。参见图2.1的??DTW对齐示意图。??作为一个有效的对齐,路径4和B必须满足以下三个约束:??1.?A{1)?=?1,5(1)?=?1??2.?A(l)?=?LQ

序列,水库模型,凸性,帕累托


图2.2帕累托前沿面的凸性对优化算法的影响??Chen等人[46]提出使用非线性的水库模型来为时间序列学习模型表示。时间??序列之间的距离定义为模型之间的函数距离。但是,该方法没有利用标签信息,??使得模型的可区分性被忽略并可能导致分类性能不佳。为了弥补这一潜在的不??足,Chen等人[49]提出了一种模型度量共同学习算法(MMCL)。MMCL将模型??和距离度量学习通过加权结合的方式转换为一个单一的目标。采用迭代梯度下??降来分别优化网络权重和距离度量。但是,由于循环网络的特点,它可能会遇到??梯度消失的问题,陷入局部最优解。另外,在多目标的情况下,最优解集合称为??帕累托最优解,其中每个解代表了在目标之间的一个权衡,可能适用于不同的特??定任务。由于帕累托最优解和线性结合参数不是一一对应的,两个目标的线性结??合可能使得帕累托最优解可能不能被全部找到,只能得到近似最优解,导致学习??的泛化精度可能受到影响。图2.2所示是对两个优化目标(图中第一列和第二列,??按照文献@中公式(8)设置),通过改变两个目标的加权系数,在解空间中搜??索解的情况,其中黄色点为目标值空间,蓝色点为优化算法找到的最优解对应??

示意图,过采样,算法,示意图


图2.3?SMOTE过采样算法示意图??过重新采样已有数据样本(随机过采样)样)。随机过釆样[18]通过复制少数类数同时可能导致过拟合合成过采样通据来重新平衡类分布。现有的过采样方行采样〃8],这种策略较适用于“平坦”的宄表明代价敏感学习和采样方法在效果缓解问题,具有更灵活的优势[56],所以法(以下在不造成混淆的情况下简称过法可生成新的人造数据点,增加少数类的技术[56],由于手写图像的数据有限,研宂额外的训练数据。合成少数类过采样技nique,?SMOTE)[56]首先为每个少数类样k个最近邻居的一个邻居并在该样本与
【相似文献】

相关期刊论文 前10条

1 孙其法;闫秋艳;闫欣鸣;;基于多样化top-k shapelets转换的时间序列分类方法[J];计算机应用;2017年02期

2 王金策;杨宁;;时间序列趋势预测[J];现代计算机(专业版);2017年02期

3 彭佳星;肖基毅;;基于分型转折点的证券时间序列分段表示法[J];商;2016年31期

4 刘伟龙;;基于ARMA模型的股价预测及实证研究[J];智富时代;2017年02期

5 周仰;;《漫长的告别》(年度资助摄影图书)[J];中国摄影;2017年04期

6 王嵬;;王嵬作品[J];当代油画;2017年07期

7 刘明华;张晋昕;;时间序列的异常点诊断方法[J];中国卫生统计;2011年04期

8 郭崇慧;苏木亚;;基于独立成分分析的时间序列谱聚类方法[J];系统工程理论与实践;2011年10期

9 王佳林;王斌;杨晓春;;面向不确定时间序列的分类方法[J];计算机研究与发展;2011年S3期

10 万里;廖建新;朱晓民;倪萍;;一种基于频繁模式的时间序列分类框架[J];电子与信息学报;2010年02期


相关博士学位论文 前10条

1 丁超;MODIS时间序列重建方法与应用[D];中国地质大学(北京);2018年

2 魏永强;煤矿瓦斯监测数据插值与预测研究[D];中国矿业大学(北京);2015年

3 杨玉军;基于机器学习的时间序列模型研究及其应用[D];电子科技大学;2018年

4 鲁韵帆;随机交互金融模型的构建及金融时间序列的统计分析[D];北京交通大学;2018年

5 郭珩;复杂网络在非线性时间序列分析中的应用[D];华东师范大学;2018年

6 宋伟;面向时间序列分类任务的SAX方法研究[D];郑州大学;2018年

7 潘玉青;基于NDVI时间序列的黄河中下游典型史前都邑性遗址的作物物候观察[D];中国科学院大学(中国科学院遥感与数字地球研究所);2017年

8 郝鹏宇;基于多时相遥感数据的农作物分类研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2017年

9 乔海浪;基于NDVI时间序列重构的经济型人工林时空分布信息提取研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2017年

10 王妮妮;基于智能计算技术的时间序列分割及预测研究[D];大连理工大学;2013年


相关硕士学位论文 前10条

1 韩新玉;网络结构特征与时间序列相互表征应用[D];哈尔滨工业大学;2017年

2 侯晓伟;高精度GPS用于地壳形变研究分析[D];长安大学;2018年

3 张旭东;基于最小哈希方法的多元时间序列近似关联规则挖掘[D];哈尔滨工业大学;2017年

4 郑毅;时间序列数据的胶囊式LSTM特征提取算法研究[D];华中师范大学;2018年

5 江粉桃;非线性方法的时间序列组合模型在农产品价格预测中的应用研究[D];兰州交通大学;2018年

6 孟凡山;基于随机特征采样的时间序列分类算法的研究与实现[D];哈尔滨工业大学;2018年

7 魏延杰;基于深度学习的复杂时间序列分析[D];哈尔滨工业大学;2018年

8 余任;基于模糊时间序列及灰色理论的金融时间序列预测研究[D];昆明理工大学;2018年

9 禹雷;基于多级联合策略的多平台MT-InSAR形变时间序列联合分析[D];华东师范大学;2018年

10 尹薇;时间序列清洗关键技术的研究[D];哈尔滨工业大学;2018年



本文编号:2894523

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/2894523.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户71d0c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com