基于粒计算的时间序列分析与建模方法研究
本文选题:粒计算 + 多粒度区间信息粒化 ; 参考:《大连理工大学》2015年博士论文
【摘要】:在当今大数据时代,个体样本数据不再是关注的焦点,而对数据的理解和认知要远比个体样本数据重要。传统的时间序列建模方法由于(1)其建模过程过分依赖于个体样本数据使得所构建的模型缺乏“可解释性”;(2)所构建的模型是以追求“数值”层面的“精确性”为目标,然而在大数据环境下,模型的精确性不是绝对必要的;(3)所构建的模型的输出是单一的数值数据,这在大数据环境下很难为用户所理解和认知,因而,它已不能完全满足当今大数据时代背景下的时间序列分析和建模的实际应用需要。作为当前计算智能领域新兴的、发展最快的信息处理范式之一,“粒计算”具有揭示人类处理复杂信息的粒化认知机理的能力,它能够将具有不同理论基础的形式体系(如集合论、模糊集、粗糙集等)联系到一起,形成一个统一的表示、描述、计算和处理信息粒的平台,这有可能诞生新的计算智能理论与方法。在这一背景下,本文从模拟人类处理复杂信息问题的粒化认知机理出发,借鉴模糊集理论思想和建模方法,紧紧围绕基于粒计算的时间序列分析和建模的三个核心问题——时间序列的合理信息粒化、基于信息粒化的时间序列分析与解释和基于信息粒化的时间序列建模,开展了研究,获得的主要研究成果包括:(1)针对在时间序列信息粒化过程中,传统的信息粒化方法只能对时间窗口上的数据在单一信息粒度水平下进行信息粒化,这可能导致产生的信息粒无法捕获相应数据的本质特征这一问题,提出了时间序列的多粒度区间信息粒化方法。所提出的粒化方法能够在区间形式体系下,通过引入信息粒的合理性和特殊性概念,将时间序列在相应时间窗口上信息粒的合理构造问题转换为一个受变量α∈[0,1]约束的区间信息粒边界的优化问题,而变量a则代表了对时间序列相应时间窗口上的数据进行信息粒化时所使用的信息粒度水平。通过在不同的α取值下,对该优化问题进行求解,来诱导相应α信息粒度水平下的区间信息粒,即可实现对时间序列同一时间窗口上所呈现数据的多粒度信息粒化。使用提出的多粒度区间信息粒化方法粒化数据时,将产生一系列嵌套的区间信息粒,它们能够被看成一个整体,即区间套信息粒,它代表了时间序列相应时间窗口上所呈现的数据在不同信息粒度水平下进行区间信息粒化的结果。(2)针对时间序列的粒化分析与解释问题,提出了一种粒特征空间中具有“嵌套”矩形几何结构的“矩形套信息粒”的聚类方法。该方法从几何角度,揭示了在粒特征空间中,由时间序列的幅值和它的一阶差分序列分别经过“多粒度区间信息粒化”所形成的“矩形套信息粒”的结构特征和它的表示方法,并借鉴模糊C-均值聚类的方法,利用矩形套信息粒的可分解和可合成特性,实现了对粒特征空间中与时间窗口相关的矩形套信息粒的聚类。更进一步,考虑在粒特征空间中所形成的粒原型蕴含着描述时间序列在相应时间窗口上所呈现数据动态特征的语义,这样,可通过计算粒特征空间中与时间窗口相关的矩形套信息粒同这些粒原型之间的匹配程度来实现基于信息粒化的时间序列分析与解释。多组时间序列数据集上的实验结果表明,基于提出的矩形套信息粒的聚类方法去分析和解释时间序列与人从粒化认知机理出发去分析时间序列所获得的结果完全一致。(3)提出了基于多粒度区间信息粒化的时间序列层次化建模方法和两个时间序列粒模型性能评价指标,实现了时间序列的粒化建模。所提出的粒化建模方法从人类处理复杂信息问题的粒化认知机理出发,在考虑时间序列的幅值和它的一阶差分序列的基础上,充分借鉴了模糊建模的基本思想,通过“多粒度区间信息粒化”来压缩时间序列规模,并将原始时间序列转换为粒时间序列;通过对粒特征空间中的矩形套信息粒进行聚类来获得用于描述时间序列在相应时间窗口上所呈现数据动态特征的语义描述,从而将领域知识融入到建模过程中;通过挖掘时间序列相应时间窗口在粒特征空间中形成的矩形套信息粒之间的动态因果关系形成时间序列粒模型。相关的实验结果表明,依据本文提出的基于多粒度区间信息粒化的时间序列层次化建模方法所构建的模糊认知图时间序列粒模型具有良好的可解释性,其输出是一个具有语义描述的信息粒(区间),反映了时间序列在相应时间窗口上数据的整体动态特征(语义)和变化范围(区间),这更容易被用户理解和认知,从而为用户做出合理的决策提供有效的支撑。
[Abstract]:In today's large data age, individual sample data is no longer the focus of attention, and understanding and cognition of data is much more important than individual sample data. The traditional time series modeling method is due to (1) its modeling process is too dependent on individual sample data to make the model constructed without "interpretability"; (2) the model is constructed. In order to pursue the "accuracy" of the "numerical" level, the accuracy of the model is not absolutely necessary in the large data environment; (3) the output of the model is a single numerical data, which is difficult for the users to understand and cognate in the large data environment, because it can not fully meet the background of today's big data age. The time series analysis and the practical application of modeling are needed. As one of the emerging and fastest developing information processing paradigms in the field of computational intelligence, "granular computing" has the ability to reveal the granulation mechanism of human processing complex information. It can make the formal systems with different theoretical foundations (such as set theory, fuzzy set, rough set, etc.). To form a unified platform for representation, description, calculation and processing of information particles, it is possible to create a new theory and method of computing intelligence. In this context, this paper, starting from the simulation of the granular cognitive mechanism for dealing with complex information problems, draws on the theory of fuzzy sets and modeling methods, closely surrounding the particle based on particles. The three core issues of time series analysis and modeling, the rational information granulation of time series, time series analysis and interpretation based on information granulation and time series modeling based on information granulation, are carried out. The main achievements are as follows: (1) in the process of granulation of time series information, the traditional letter The granulation method can only grained information on a single information granularity level on the time window, which may lead to the problem that the generated information can not capture the essential characteristics of the corresponding data, and proposes a multi granularity interval information granulation method of time series. The proposed granulation method can be used in the interval form system. By introducing the concept of rationality and particularity of information particles, the rational construction of time series of information particles on the corresponding time window is converted into an optimization problem of the interval information particle boundary of a variable [0,1] constraint, while the variable a represents the use of the information granulation of the data on the corresponding time window. The level of information granularity. By solving the optimization problem under different alpha values to induce the interval information particles at the level of corresponding alpha information granularity, the multi granularity information of the data presented on the same time window can be realized. A series of nested interval information particles, which can be considered as a whole, that is, the interval set of information particles, which represents the result of the interval information granulation of the data presented on the corresponding time window at the level of different information granularity. (2) a particle feature space is proposed for the problem of the granulation analysis and interpretation of time series. The clustering method of "rectangle set of information particles" with "nested" rectangular geometric structure is used in this method to reveal the structural features of "rectangular set of information particles" formed by the "multi granularity interval information granulation" from the amplitude of time series and the first order difference sequence of its first order difference sequence in grain feature space from the geometric point of view. By using the method of fuzzy C- means clustering, and using the decomposition and synthesis characteristics of the rectangle set of information particles, the clustering of the rectangle set of information related to the time window in the granular feature space is realized. The semantics of the dynamic characteristics of the data are presented so that the time series analysis and interpretation based on the information granulation can be realized by calculating the matching degree of the rectangular set of information particles related to the time window in the grain feature space and the matching degree between the particles. The experimental results on the multi group time series data set show that the proposed rectangle information is based on the experimental results. The clustering method of grain is used to analyze and explain the time series and the results obtained from the analysis of time series from the granulated cognitive mechanism. (3) a hierarchical modeling method of time series based on multi granularity interval information granulation and the performance evaluation index of two time sequence grain models are proposed, and the granulation modeling of time series is realized. On the basis of the magnitude of time series and its first order difference sequence, the proposed granulation modeling method, based on the magnitude of time series and its first order difference sequence, fully draws on the basic idea of fuzzy modeling and compresses the scale of time series by "granulation of multi granularity interval information", and turns the original time series. It is replaced by a grain time sequence; a semantic description of the dynamic characteristics of the data used to describe the time series on the corresponding time window is obtained by clustering the rectangular set of information particles in the grain feature space, and the domain knowledge is incorporated into the modeling process, and the corresponding time window is formed in the granular feature space by mining the time sequence. The experimental results show that the time series model of fuzzy cognitive map based on the hierarchical modeling method of time series based on multi granularity interval information granulation proposed in this paper has good interpretability, and its output is a language. The information particle (interval) described in semantic description reflects the overall dynamic characteristics (semantics) and variation range (interval) of the time series of data on the corresponding time window, which is more easily understood and recognized by the user, thus providing effective support for the user to make a reasonable decision.
【学位授予单位】:大连理工大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP18;O211.61
【相似文献】
中国期刊全文数据库 前10条
1 施久玉,杜金观;有限个状态时间序列的某些结果[J];应用数学学报;1990年01期
2 冯希杰;长江三峡及其邻区断裂活动时间序列[J];华南地震;1991年02期
3 王霞,郭嗣琮,刘淑娟;时间序列模糊滑动预测[J];辽宁工程技术大学学报(自然科学版);1999年03期
4 温品人;时间序列预测法的实际应用分析[J];江苏广播电视大学学报;2001年06期
5 许清海;混沌投资时间序列的嬗变[J];漳州师范学院学报(自然科学版);2003年01期
6 程毛林;时间序列系统建模预测的一种新方法[J];数学的实践与认识;2004年08期
7 高洁;长记忆时间序列适应性预测的应用[J];江南大学学报;2004年05期
8 高洁;孙立新;;长记忆时间序列的适应性预测误差的谱密度[J];统计与决策;2006年13期
9 杨钟瑾;;浅谈时间序列的分析预测[J];中国科技信息;2006年14期
10 李健;孙广中;许胤龙;;基于时间序列的预测模型应用与异常检测[J];计算机辅助工程;2006年02期
中国重要会议论文全文数据库 前10条
1 周家斌;张海福;杨桂英;;多维多步时间序列预报方法及其应用[A];中国现场统计研究会第九届学术年会论文集[C];1999年
2 马培蓓;纪军;;基于时间序列的航空备件消耗预测[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年
3 卢世坤;李夕海;牛超;陈蛟;;时间序列的非线性非平稳特性研究综述[A];国家安全地球物理丛书(八)——遥感地球物理与国家安全[C];2012年
4 李强;;基于线性模型方法对时间序列中异常值的检测及证券实证分析[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年
5 戴丽金;何振峰;;基于云模型的时间序列相似性度量方法[A];第八届中国不确定系统年会论文集[C];2010年
6 谢美萍;赵希人;庄秀龙;;多维非线性时间序列的投影寻踪学习逼近[A];'99系统仿真技术及其应用学术交流会论文集[C];1999年
7 张大斌;李红燕;刘肖;张文生;;非线性时问序列的小波-模糊神经网络集成预测方法[A];第十五届中国管理科学学术年会论文集(下)[C];2013年
8 黄云贵;;基于时间序列的电网固定资产投资规模研究[A];2012年云南电力技术论坛论文集(文摘部分)[C];2012年
9 李松臣;张世英;;时间序列高阶矩持续和协同持续性研究[A];21世纪数量经济学(第8卷)[C];2007年
10 陈赫;罗声求;;历史横断面数据的时间序列化[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
中国重要报纸全文数据库 前6条
1 ;《时间序列与金融数据分析》[N];中国信息报;2004年
2 何德旭 王朝阳;时间序列计量经济学:协整与有条件的异方差自回归[N];中国社会科学院院报;2003年
3 刘俏;让数据坦白真相[N];21世纪经济报道;2003年
4 西南证券高级研究员 董先安邋德圣基金研究中心 郭奔宇;预计6月CPI同比上涨7.2%[N];证券时报;2008年
5 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年
6 任勇邋郑重;中国对世界钢材价格的影响实证分析[N];现代物流报;2007年
中国博士学位论文全文数据库 前10条
1 张墨谦;遥感时间序列数据的特征挖掘:在生态学中的应用[D];复旦大学;2014年
2 张德成;滑坡预测预报研究[D];昆明理工大学;2015年
3 苗圣法;时间序列的模式检测[D];兰州大学;2015年
4 翁同峰;时间序列与复杂网络之间等价性问题及表征应用研究[D];哈尔滨工业大学;2015年
5 杨婷婷;用Argo浮标结合卫星观测估算北太平洋经向热输运[D];中国科学院研究生院(海洋研究所);2015年
6 史文彬;时间序列的相关性及信息熵分析[D];北京交通大学;2016年
7 原继东;时间序列分类算法研究[D];北京交通大学;2016年
8 卢伟;基于粒计算的时间序列分析与建模方法研究[D];大连理工大学;2015年
9 王晓晔;时间序列数据挖掘中相似性和趋势预测的研究[D];天津大学;2003年
10 李桂玲;时间序列的分割及不一致发现研究[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 陈健;基于多变量相空间重构的投资组合策略研究[D];华南理工大学;2015年
2 兰鑫;时间序列的复杂网络转换策略研究[D];西南大学;2015年
3 米晓将;区域尺度下月均气温的时空演化格局研究[D];昆明理工大学;2015年
4 张鸣敏;基于支持向量回归的PM_(2.5)浓度预测研究[D];南京信息工程大学;2015年
5 林健;基于改进小世界回声状态网的时间序列预测[D];渤海大学;2015年
6 曹智丽;日气温和干旱指数支持向量回归预测方法[D];南京信息工程大学;2015年
7 高雄飞;基于分形理论的土壤含水量时间序列特性分析[D];长安大学;2015年
8 姚茜;城市安全生产发展目标研究[D];中国地质大学(北京);2015年
9 谢翠颖;苏州社会消费品零售总额简析[D];苏州大学;2015年
10 包仁义;基于时间序列的搜索引擎评估模型算法研究[D];东北师范大学;2015年
,本文编号:2035756
本文链接:https://www.wllwen.com/kejilunwen/yysx/2035756.html