当前位置:主页 > 科技论文 > AI论文 >

基于EMD与神经网络的中国股票市场预测

发布时间:2016-11-19 07:09

  本文关键词:基于EMD与神经网络的中国股票市场预测,由笔耕文化传播整理发布。


第30卷第6期

2010年6月

文章编号:1000-6788(2010)06-1027-07Systems系统工程理论与实践Engineering—Theory&Practice中图分类号:TP27文献标志码:AV01.30,No.6June,2010

基于EMD与神经网络的中国股票市场预测

王文波-,费浦生z,羿旭明2

(1.武汉科技大学湖北省冶金工业过程系统科学重点实验室,武汉430065;2.武汉大学数学与统计学院,武汉430072)

摘要应用EMD分解算法、混沌分析和神经网络理论提出了一种中国股票市场建模及预测的

EMD神经网络模型.首先应用EMD分解算法把原始股市时间序列分解成不同尺度的基本模态分

量,并在此基础上进一步分析,表明中国股市存在混沌特性;再经混沌分析和神经网络进行组合预

测,提高了模型对多种目标函数的学习能力,有效提高了预测精度.实验表明:与现有方法相比,该

方法具有较高的精度.

关键词经验模态分解;股市预测;混沌分析;神经网络

PredictionofChinastockmarketbased

EMDandneuralnetwork

WANGWen-b01,FEIPu-shen92,YIXu-min92on

(1.HubeiProvinceKeyLaboratoryofSystemsScienceinMetallurgicalProcess,WuhanUniversityofScienceand

Technology,Wuhan430065,China;2.SchoolofMathematicsandStatistics,WuhanUniversity,Wuhan430072,China)AbstractFollowingempiricalmodedecomposition(EMD),chaosanalysisandneuralnetworktheory,,a

methodispresented

serialistomodelandforecaststockmarket.First,usingEMDtheory,thestockmarkettimecandecomposedintomanyintrinsicmodalfunctions(IMF)whichsignificantlyrepresentpotential

informationoforiginaltimeserial,andthefurtheranalysisofIMFindicatesthatChinastockmarketexists

achaosfeature.Then,byusingchaostheoryandneuralnetwork,theforecastingmodelsareestablished

toforecasttheIMFrespectively.Bythesemeans,themodel

morepreciouspredictioncancanbeimprovedtolearnvariousobjectivefunctionandbeobtmned.Theexperimentsshowthatthepresentedmethod

Caneffectivelyimprovethepredictionaccuracy.

Keywordsempiricalmodedecomposition;stockmarketprediction;chaosanalysis;neuralnetwork

1引言

股票市场是涉及金融、经济、政治、社会以及股民心理等诸多影响因素的复杂的动力学系统,其变化过程具有非线性、混沌性、长期记忆性等特点[1-2J.Peters指出金融市场包括股票市场是由不同投资时间水平的交易者组成的,如短期、中期和长期交易者等【3】.不同类型的交易者以不同的时间尺度看待和影响市场:短期交易者只关注市场短期的价格变换,其行为引起的价格波动只具有短期的记忆;长期交易者关注市场长期范围内的价格变化,其行为所引起的价格波动具有长期的记忆.由于不同类型交易者的投资理念、受影响因素及投资策略不同,他们所引起的股票价格波动特征完全不同,分散反映在相应的不同时间尺度上.近年来,神经网络理论在股市时间序列分析、建模及预测等方面得到了广泛的应用[4-5J.小波分析在时域和频域都具有良好的多尺度分析能力,能把时间序列按不同的尺度分解成不同的层次.基于小波分析的人工神经网络结合了两者的优势,已广泛应用于股票市场的分析研究【6_7】.但小波变换有以下两点不足ISl,第一,小波分解是利用基函数(小波基)来模拟信号,本质上还是一种窗口可调的傅里叶变换,没有从根本上摆脱傅里叶分析的局限.因此小波分解不能根据信号本身特性实现自适应的多分辨分析,为了模拟原信号,通常会产生很多本身并不存在的虚假的谐波.第二,在小波分解过程中,分解尺度的大小要预先给定,且不能再改变,但信收稿日期:2009-02-20

资助项目:国家自然科学基金(70771080);冶金工业过程系统科学重点实验室基金(C20100)作者简介:王文波(1978-),男,博士,副教授,主要从事小波分析和EMD算法在非线性信号处理等方面的研究.

1028系统工程理论与实践第30卷号中包含的时间尺度通常并不能预先知道,这就导致小波分解时,并不能把信号中所包含的尺度完整的分离出来.1998年Huang提出了经验模态分解算法f9】(Empiricalmodedecomposition,EMD),EMD是基于信号局部特征时间尺度,从原信号中提取固有模态函数(Intrinsicmodefunction,IMF).该方法从本质上讲是对一个信号进行平稳化处理,其结果是将信号中不同尺度的波动或趋势逐级分解开来,产生一系列具有不同特征尺度的数据序列,每—个序列代表一个固有模态函数.这使得分解得到的各个IMF具有明显的物理背景,每—个IMF代表了原信号中所包含的—个尺度波动成份,而余项通常代表原信号的趋势或均值.EMD算法与小波算法相比,可以更准确地反映系统原有的物理特性,有更强的局部表现能力.所以在处理非线性、非平稳信号时,EMD方法更为有效【10】.股票信号经EMD算法分解后,可得到若干个彼此间影响甚微的基本模式分量,这些分量具有不同的尺度,代表了不同投资时间水平的交易者所引起的股市价格波动,从而简化了股市序列中不同尺度的特征信息之间的干涉或耦合.如果直接将原始股票数据输入神经网络,信号的特征量并不突出,神经网络需要耗费较长的时间来认识把握信号的特征.而EMD方法中分解出来的IMF分量本身就代表了原信号的不同的局部特征,因此如果将不同的IMF分量同时并行输入到神经网络中进行训练,就使神经网络能够更好地认识、把握原信号的特征,从而大大提高了学习训练的效率和进行判别的准确性【1l】.本文将EMD方法和递归神经网络模型(DRNN)相结合,对中国股票市场进行预测.首先利用EMD方法把股市数据分解成若干个IMF,再对每个IMF分量利用递归神经网络进行预测,然后用各个分量的预测值重构出原始信号的预测序列,从而提高预测精度.实验表明,该方法是有效的.

2基于EMD分解和混沌分析的神经网络结构

2.1EMD分解算法

EMD算法基于这样的假设:任何信号都是由一系列幅度和相位都随时间变化的基本模式分量构成,这种基本模式分量必须满足两个条件,即它的零点数与极点数相等或至多相差1个,以及由它的极大值和极小值确定的上下包络线关于时间轴局部对称.Huang将这种基本模式分量定义为固有模态函数,即IMF.EMD方法可以将多分量信号的各阶IMF一一筛选出来,具体步骤如下:设原始的信号为s(t),

1)确定s(t)的所有极大值和极小值;

2)根据极大值和极小值作三次样条插值来构造s(£)的上下包络线;

3)根据上下包络线,计算出s(£)的局部均值mil(t)以及s(£)和m11(t)的差值hll(t)=s—m11(£);

4)以h11(t)代替原始信号s(t),重复以上三步,直到hi(k-1)与hlk之间的方差小于某一设定值,即认为hlk是一个IMF分量,记Cl=hlk,rl(t)=s(t)一C1,8(t)=rl(t);

5)重复以上四步,直到‰小于一设定值,或者‰变成了一个单调函数时,原始信号的EMD分解结束,得到8(t)的分解形式如下:8(t)=∑竺1

特征,并且是窄带信号.

2.2混沌序列的递归神经网络结构算法Q+r,每一个IMF分量都反映了原信号不同实践尺度的内在模态

在混沌时间序列中,系统中每个分量的变化都是由与其相互作用的其他分量所决定的.因此,每个分量的演化过程都包含着整个系统的信息,动力系统中单分量的实测时序x(t)是一维的,动力系统的全部本质特征都隐藏在这一时序中.将动力系统的本质特征从这一维时序中提取出来是求解特征值和特征向量的重要内容.为了能够从时间序列中得到动力系统相空间的几何结构,Packard等人采用时间延滞技术,他们把一维时间空间序列嵌入到m维空间中,则x(t)={z(£),x(t—T),…,x(t一(m一1)T)),其中,x(t)表示t时刻系统的动力学状态,T为延迟时间,m是嵌入空间矩阵的维数.由此可以建立相空间到嵌入空间的映射,则在相空间中必然存在函数,(.)使得延时后的状态x(x+T)和当前状态x(t)之间满足x@+T)=,(x(t)),其中,(.)是待寻找的预测函数,延迟时间7.和嵌入维数m可以通过不同的方法获得.

对上述模型,可用神经网络进行模拟.首先利用混沌相空间重构理论,获得有关神经网络结构的先验知识,以便合理构建神经网络模型.当进行混沌时间序列预测时,若时间序列为—个有限离散序列时,可使用内插法对序列进行扩充,而后再进行混沌参数分析.设刀=l,2,…,在舻空间中存在光滑函数,满足岔(t7+叩T)=f7(x(£,)),式中叩T为预测步数【12】,本文中取町T=1,进行单步预测.最佳延迟和嵌入维数可使用互信息量法和G_P算法得到,直接单步预测最大的特点是预测模型的输入数据均为测量值,得到的单步预测模

第6期王文波,等:基于EMD与神经网络的中国股票市场预测1029型可由下式表示:

圣0+1)=,(z0),z@一T),…,z@一(M一1)T))

式中的M为神经网络输入节点数,{z(i)Iz≤t+1,为测量值.(1)

3基于EMD的递归神经网络单步预测模型

根据股票数据的混沌特性[1,13l,本文将EMD分解法和神经网络结合起来,建立—个新的神经网络集成结构.首先对股票数据进行EMD分解,得到包含各个时间尺度特征的基本模式分量IMFs;再通过—个分离的神经网络对每—个IMF进行预测;然后通过另—个线性神经网络,将前一阶段中的每—个IMF的预测结果作为输入,对原始序列的下—个样本进行预测.整个网络分为三个阶段(如图1所示),第一阶段中,包括EMD分解单元和插值单元,InX(t)和Inimfi为插值后数据;第二阶段中,NS为结构设计单元;第三阶段中,EDNN表示基于EMD的递归神经网络,M是—个没有隐层的线性神经网络结构,q为原始数据经EMD算法分解后得到的IMF分量的个数.

。第一阶段.第二阶段第!阶段。

图1基于EMD的递归神经网络模型结构

设给定一股票数据{x(t)lt=1,2,…,n),n是时间序列的样本点数。则预测算法的具体实现算法如下:1)利用EMD算法分解股票时间序列.在第一步中,将股票时间序列{x(t)lt=1,2,…,佗)利用EMD算法进行分解,得到有限个基本模式分量{im五(t)忙=1,2,…,n;i=1,2,…,口).

2)利用相空间重构理论对神经网络重要参数进行预测.若对序列进行内插,则称为插值倍数,股票时间序列经EMD分解后,在进入神经网络之前,使用内插算法对原始序列和每个基本模式分量进行扩展.因此可得到序列X他7)={。他7)It7=1,2,…,n7,及{iraf"(£7)It7=1,2,…,n7;i=1,2,…,g),此时(1)式用公式表示即为:畲(t7+(A+1)p)=,(。他,),z,(亡7一T),…,z他7一(M一1)T)).

在神经网络中,关于时间延迟,由S(m,N,r’T)【14】为基础构造统计量来确定最佳时间延迟T7,在S和T关系图上第—个极小值对应最佳延迟T7;嵌入维数的选择使用ln(G。(r))与lnr的关系求得【15】.在选取相空间重构中的最佳延迟T7为神经网络中的T后,网络的输入层节点数M=m.因此,神经网络模型可表示为[161:s(t7+(A+1))=力(u【2--*2】s(t7)+u【1---’2】z7(∥)+o(2】),圣(t7+A+1)=u【2--*3】s(£7+(1+入))+一引,其中力(.)是—个Ⅳ维的向量集合,包括所有隐层神经元的激活函数,那么隐层神经元的状态集合可由下式表示:。

s(t7(1+入))=【8r(t7+(A+1)),s91(t’+(A+1)),…,s熟(t7+(A+1))J,

其中神经网络的学习算法选用正向传播算法[17-1s]来实现.

3)对不同的分量预测完后,得到预测结果岔七(t+1),k=1,2,…,口+1.然后通过—个单层的感知器,对{钆0+1)}进行线性组合来预测原始时间序列的下一个样本点岔@+1),即圣(t+1)=∑:三:u}圣南(t+1).该层网络没有隐层,输入层数目等于第二步中的多层神经网络的个数,即imf的个数g;其输出单元是线性的,对于权值向量uiO=1,2,…,口)的计算,为了计算最小范数解,它的训练可以通过文献【19]中所述算法来完成.

系统工程理论与实践第30卷

4实验结果与讨论

本文选取的实验数据如下:

1)1997-01.02至2002—03-29的上证综合指数(000001)和深证成份指数(9901)日收盘值的对数收益率数据(对数收益率,即rt=lnpjp(t一11,其中pt为第t天的收盘价);

2)随机选取上证A股中两只股票(SH600005和SH600051)从2000-4-3至2005—7-22的日收盘价;

3)随机选取深证A股中两支股票(SZ000043和SZ000045)从1999—8.3至2004-10.25的日收盘价.所选取数据的样本数量都为1259个,分别记为Datal,…,Data6,利用EMD神经网络算法对股市进行建模和预测.因为对股市混沌时序只能做短期预测,所以把每个时间序列的前1200个数据作为训练集,后面59个数据作为观察值来检验模型的预测效果,仅用最新的数据作一步预测,采用标准均方根误差(RMSE)衡量预测结果.

0m

n叭

0扣04∞60080010001加0

_o.1L........J‘.........L.........L........JL........JL....._J

8D004006∞10D012叩o伊州叫黼叩忡Ⅷ彻0们00叭0枷400咖印010001瑚

0.05广—————,——————,————————————————————————1

ox1矿50

弓lu-H“_?I?门-.山Ih_忡d帅玉-.I.一

;阿弋一量区三歪

左列从上到F分别是:原始信号,f,硝,im畈,魄‘,嘲;

图2右列从上到下分别是:拥睡,f,,哌,魄7;,f,蜕和余项E证综合指数的对数收益率EMD分解结果

对Datal经EMD分解后,产生8个基本模式分量(如图2所示).根据原始数据和8个分解后数据设计神经网络的拓扑结构,这里需要计算原始数据Datal及imfi,t=1,2,…,8的最佳延迟时间与嵌入维数.由于测鼍数据是有限的离散数据,可根据计算需要对其进行不同数量的插值处理,计算出S—t关系,得到原始数据及8个模式分量的最佳延迟分别为:6,6,4,7,9,8,8,5,3;将延迟时间代入G_P算法,经计算可得到原始数据Datal及模式分量im]i,i=1,2,…,8的hC—lIlr关系图,由此得到嵌入维数与关联维数的对应关系(如表1所示),因此各序列的嵌入维数为:10,10,8,12,14,15,7,3,3.在本文的EMD神经网络中输入节点个数和时间延迟分别等于序列的嵌入维数和最佳延迟.隐层节点数的确定采用试凑法,分别得到9个网络的结构为:10-12—1,10-12—1,8-6-1,12—12.1,14-12—1,15—8-l,7-9-1,3-3-1,3-3-1.对Data2,…,Data6按照同样方法进行预测,预测结果如图3所示.从图3(a)和图3(5)中可以看出,在对上证综指和深证成指的对数日收益率预测中,从第1个点到第59个点,预测的效果都较好,精度较高.而四支股票的日收盘价的预测中(图3(c)一图3(f)),前一部份点(前15个点左右)预测的精度较好,随着预测点个数的增加,误差也逐渐增加,特别是最后一段(第50个点以后),预测值与实际值之间的误差已经非常大.

出现这种情况可能与上证指数和深成指数的性质有关,这两种指数都是以大量上市股票为样本,按加权


  本文关键词:基于EMD与神经网络的中国股票市场预测,由笔耕文化传播整理发布。



本文编号:182145

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/rengongzhinen/182145.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1823c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com