当前位置:主页 > 经济论文 > 股票论文 >

基于小波消噪的聚类模式挖掘在股票收益率预测中的应用

发布时间:2020-05-23 04:11
【摘要】:金融管理研究的一个显着特点是数据分析量非常大、不确定性因素多,面对当今时代的海量金融数据,基于传统的统计技术建立的模型假设条件多,在实际应用中难以凑效。数据挖掘是20世纪90年代中期兴起的统计决策新技术,其过程是发现海量数据中有用的模式,目的在于使用所发现的模式帮助解释当前的行为或预测未来的结果,以人们容易理解的形式提供有用的决策信息。 随着IPO的重启,我国的股票市场不断的扩张,股票交易数据规模越来越大,寻找股票价格有价值的模式信息也越来越困难。股票时间序列本质上具有非线性、非平稳、信噪比低的特点,数据挖掘是为了发现序列中隐含的一些本质规律,高噪声的存在一方面淡化规律的显着性,另一方面也可能会提供一些假信息,从而严重影响数据挖掘的效果。 针对上述两个关键问题,本文重点研究了基于小波消噪的聚类模式挖掘在股票收益率预测中的应用。本文主要拟完成的研究工作包括以下几个方面: (1)探讨了数据挖掘技术应用在金融领域的重要性和必要性;并就从海量金融数据中挖掘其隐含模式进行可能性分析; (2)考虑到金融时间序列数据的高噪声性,本文拟利用小波去噪方法对数据进行预处理,并提出改进的小波阂值去噪方法,选取合适的小波基函数、阈值准则、阈值处理函数和分解层数对数据进行去噪处理; (3)结合聚类分析方法和时态序列模式挖掘技术构建聚类时态序列模式挖掘技术模型,改进传统的时态序列模式挖掘技术中的不足之处,优化其算法,并利用随机数据进行模拟实验,验证其模式挖掘的效果; (4)利用构建的聚类时态模式挖掘技术模型进行实证研究,选取沪深两市各20只股票,选取2005年1月31日到2007年12月31日的股票收盘价为数据样本,将其中前一半数据作为模式挖掘对象,后一半数据作为模式验证对象,判断模式挖掘的有效性,并利用挖掘出的隐含模式对未来作出决策和预测。
【图文】:

聚类,层次聚类,凝聚法


发现任意形状的类。基于密度的聚类方法主要有基于高密度区域连接的DBSCAN、基于密度分度函数的DENCLUE和基于数据排序的OPTICS方法等。基于密度的聚类是对数据发生频率的刻画,如图2一1所示。..勺补一一。一.。.一二.:图2一1不同密度的聚类2.2.4层次聚类方法层次聚类法,也称为系统聚类方法,是对给定的数据集按层次分解,形成一颗以数据子集为节点的树。层次聚类法按照聚类的过程可分为凝聚(a路lomerative)和分裂(divisive)两类方法。凝聚法就是把每个数据点看作一类,采用自底向上的方法,把最邻近的点合为一类,再把这个类和其他最临近的类结合,知道所有数据合并成一类或满足某一个给定的闽值条件为止[32]。而分裂法则刚好相反,是把所有数据看作一类,采用自顶而下的方法,按两个子类距离最大原则,将一个类分成若干子类,直到每个数据点自成一类或满足给定的闭值条件为止。其中闽值条件一般是用户希望得到的类的数目。AGNEs(agglomerative)和 nIANA(divisiveanal”15)(Kau加 anetal.1990)是早期的层次聚类法,前者属于凝聚法,后者属于分裂法。代表性的层次方法有CURE、Chameleon和BIRCH。AGNES和DIANA聚类过程如图2一2所示。

层次聚类,聚类


发现任意形状的类。基于密度的聚类方法主要有基于高密度区域连接的DBSCAN、基于密度分度函数的DENCLUE和基于数据排序的OPTICS方法等。基于密度的聚类是对数据发生频率的刻画,,如图2一1所示。..勺补一一。一.。.一二.:图2一1不同密度的聚类2.2.4层次聚类方法层次聚类法,也称为系统聚类方法,是对给定的数据集按层次分解,形成一颗以数据子集为节点的树。层次聚类法按照聚类的过程可分为凝聚(a路lomerative)和分裂(divisive)两类方法。凝聚法就是把每个数据点看作一类,采用自底向上的方法,把最邻近的点合为一类,再把这个类和其他最临近的类结合,知道所有数据合并成一类或满足某一个给定的闽值条件为止[32]。而分裂法则刚好相反,是把所有数据看作一类,采用自顶而下的方法,按两个子类距离最大原则,将一个类分成若干子类,直到每个数据点自成一类或满足给定的闭值条件为止。其中闽值条件一般是用户希望得到的类的数目。AGNEs(agglomerative)和 nIANA(divisiveanal”15)(Kau加 anetal.1990)是早期的层次聚类法,前者属于凝聚法,后者属于分裂法。代表性的层次方法有CURE、Chameleon和BIRCH。AGNES和DIANA聚类过程如图2一2所示。
【学位授予单位】:武汉理工大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:F224;F832.51

【相似文献】

相关期刊论文 前10条

1 孙倩;;摭论“图书情报学博客”的组织和管理模式[J];中国报业;2011年06期

2 ;[J];;年期

3 ;[J];;年期

4 ;[J];;年期

5 ;[J];;年期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相关会议论文 前10条

1 李润恒;贾焰;金鑫;;一种面向网络安全的序列模式挖掘方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年

2 李晟;姜青山;郭顺;王备战;;一种优化的蛋白质序列模式挖掘方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

3 朱辉生;李存华;;序列模式挖掘的研究与实现[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

4 赵畅;杨冬青;唐世渭;郭迎春;;Web日志序列模式挖掘工具SPMiner的设计[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

5 牛兴雯;杨冬青;唐世渭;王腾蛟;;OSAF-tree——可迭代的移动序列模式挖掘及增量更新方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

6 任家东;解玉洁;何海涛;张爱国;;基于改进前缀树PStree的最大序列模式挖掘[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

7 刘琪;牛文静;顾兆军;;基于API调用序列的恶意代码动态分析方法研究[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年

8 窦赫男;刘正捷;夏季;;序列模式挖掘在网站可用性分析研究上的应用[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国人机交互学术会议(CHCI'06)论文集[C];2006年

9 何星星;谢伙生;;流数据中一种高效剪枝的频繁序列挖掘算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

10 周涛;;基于数据挖掘的入侵检测日志分析技术研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年

相关重要报纸文章 前1条

1 惠琳;数据挖掘 提升核心竞争力[N];首都建设报;2009年

相关博士学位论文 前10条

1 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年

2 谢飞;带有通配符的序列模式挖掘研究[D];合肥工业大学;2011年

3 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年

4 兰秋军;金融时间序列隐含模式挖掘方法及其应用研究[D];湖南大学;2005年

5 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年

6 宋世杰;基于序列模式挖掘的误用入侵检测系统及其关键技术研究[D];国防科学技术大学;2005年

7 金阳;基于概念格模型的序列模式挖掘算法研究[D];吉林大学;2007年

8 熊峗;生物序列模式挖掘与聚类研究[D];复旦大学;2007年

9 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年

10 单莘;基于知识发现的告警相关性分析关键问题研究[D];北京邮电大学;2006年

相关硕士学位论文 前10条

1 王永强;基于DF2Ls的序列模式挖掘研究[D];兰州大学;2011年

2 柳建芳;基于小波消噪的聚类模式挖掘在股票收益率预测中的应用[D];武汉理工大学;2010年

3 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年

4 魏龙;GML时空序列模式挖掘研究[D];江西理工大学;2011年

5 窦赫男;序列模式挖掘在网站可用性分析研究上的应用[D];大连海事大学;2006年

6 祝效普;WEB用户访问序列模式挖掘[D];天津大学;2005年

7 梁伟;Web使用挖掘在电子商务推荐系统中的应用研究[D];天津大学;2004年

8 管恩政;序列模式挖掘算法研究[D];吉林大学;2005年

9 仇大伟;基于序列数据库的数据挖掘系统的设计和研究[D];山东科技大学;2005年

10 郭跃斌;基于序列模式的正负关联规则挖掘技术[D];山东轻工业学院;2008年



本文编号:2677129

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/2677129.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户78361***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com