面向股票聚类的相似度和评价指标的研究
发布时间:2022-02-19 23:42
随着金融行业IT技术日新月异的发展,企业积累了海量的金融数据。如何从金融时间序列的内在结构和趋势挖掘有价值的信息,是既有挑战也有现实意义的工作。面对规模巨大的金融数据,除了可以使用经典的时间序列分析技术,还可以使用数据挖掘和机器学习的方法。数据驱动的机器学习和数据挖掘擅长的就是从数据中挖掘模式和预测趋势。用机器学习技术对数据进行多层次、多角度分析,使得管理者基于过去的企业状况对未来趋势进行预判,进而提供科学合理的决策。基于相关性对股票进行聚类,不仅是捕捉市场信息、制定投资策略的关键,而且有助于理解市场的运作机制。本文以金融数据中最常见的股票数据为载体,通过聚类算法探索股票数据蕴藏的有价值的信息。本文对股票聚类的相似度和聚类评价指标进行了研究,主要的研究内容分为以下两方面。首先,在股票聚类的相似性度量方面,提出了基于Copula函数的线性融合相关系数LinearSLU和非线性融合相关系数NonLinearSLU。相关系数是常用的股票时间序列相似性度量,但是经典的相关系数无论是Pearson相关系数还是秩相关系数都有局限性。为了充分利用不同相关系...
【文章来源】:深圳大学广东省
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 选题的背景和研究意义
1.2 金融时间序列相似性度量的研究现状
1.2.1 基于形状的金融时间序列相似度
1.2.2 基于特征的金融时间序列相似度
1.2.3 基于模型的金融时间序列相似度
1.2.4 金融时间序列的相关性
1.3 聚类评价的研究现状
1.4 本文的研究内容
1.5 本文的组织结构
第2章 相关知识
2.1 Copula函数简介
2.1.1 Copula函数
2.1.2 阿基米德Copula函数
2.2 股票时间序列的相似性度量
2.2.1 基本度量方法
2.2.2 基于Copula函数的相关性
2.3 聚类算法
2.3.1 聚类的基本概念
2.3.2 Affinity Propagation聚类算法
2.3.3 谱聚类算法
2.3.4 凝聚层次聚类算法
2.4 聚类评价
2.4.1 外部评价指标
2.4.2 内部评价指标
2.5 本章总结
第3章 基于Copula函数的融合相关系数
3.1 引言
3.2 基于Copula函数的融合相关系数
3.2.1 Linear_SLU融合相关系数
3.2.2 NonLinear_SLU融合相关系数
3.2.3 融合相关系数的特点
3.2.4 基于Copula函数的融合相关系数的计算
3.2.4.1 EM算法估计M-copula函数的参数
3.2.4.2 Linear_SLU融合相关系数的计算
3.2.4.3 NonLinear_SLU融合相关系数的计算
3.3 实验设计与结果分析
3.3.1 实验数据与预处理
3.3.2 实验环境与实验设置
3.3.3 股票聚类的定性分析
3.3.4 股票聚类的指标分析
3.4 本章总结
第4章 基于有效前沿的股票聚类评价
4.1 引言
4.2 基于有效前沿的股票聚类评价指标BEF
4.2.1 投资组合和有效前沿曲线
4.2.2 簇代表选择算法
4.2.3 BEF值的数学定义
4.3 BEF值的性质探究
4.3.1 BEF值随聚类数目的变化趋势
4.3.2 不同相关系数下BEF值的稳定性
4.3.3 股票聚类的最佳数目
4.4 本章总结
第5章 总结和展望
5.1 本文总结
5.2 展望
参考文献
致谢
攻读硕士学位期间的研究成果
附录Ⅰ
附录Ⅱ
【参考文献】:
期刊论文
[1]一种基于DTW的新型股市时间序列相似性度量方法[J]. 冯钧,陈焕霖,唐志贤,吴德. 数据采集与处理. 2015(01)
[2]评价股票聚类的Ward权熵指标[J]. 王宁,荣喜民,何丽. 统计与信息论坛. 2015(01)
[3]基于近邻传播算法的最佳聚类数确定方法比较研究[J]. 周世兵,徐振源,唐旭清. 计算机科学. 2011(02)
博士论文
[1]聚类分析中的最佳聚类数确定方法研究及应用[D]. 周世兵.江南大学 2011
本文编号:3633858
【文章来源】:深圳大学广东省
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 选题的背景和研究意义
1.2 金融时间序列相似性度量的研究现状
1.2.1 基于形状的金融时间序列相似度
1.2.2 基于特征的金融时间序列相似度
1.2.3 基于模型的金融时间序列相似度
1.2.4 金融时间序列的相关性
1.3 聚类评价的研究现状
1.4 本文的研究内容
1.5 本文的组织结构
第2章 相关知识
2.1 Copula函数简介
2.1.1 Copula函数
2.1.2 阿基米德Copula函数
2.2 股票时间序列的相似性度量
2.2.1 基本度量方法
2.2.2 基于Copula函数的相关性
2.3 聚类算法
2.3.1 聚类的基本概念
2.3.2 Affinity Propagation聚类算法
2.3.3 谱聚类算法
2.3.4 凝聚层次聚类算法
2.4 聚类评价
2.4.1 外部评价指标
2.4.2 内部评价指标
2.5 本章总结
第3章 基于Copula函数的融合相关系数
3.1 引言
3.2 基于Copula函数的融合相关系数
3.2.1 Linear_SLU融合相关系数
3.2.2 NonLinear_SLU融合相关系数
3.2.3 融合相关系数的特点
3.2.4 基于Copula函数的融合相关系数的计算
3.2.4.1 EM算法估计M-copula函数的参数
3.2.4.2 Linear_SLU融合相关系数的计算
3.2.4.3 NonLinear_SLU融合相关系数的计算
3.3 实验设计与结果分析
3.3.1 实验数据与预处理
3.3.2 实验环境与实验设置
3.3.3 股票聚类的定性分析
3.3.4 股票聚类的指标分析
3.4 本章总结
第4章 基于有效前沿的股票聚类评价
4.1 引言
4.2 基于有效前沿的股票聚类评价指标BEF
4.2.1 投资组合和有效前沿曲线
4.2.2 簇代表选择算法
4.2.3 BEF值的数学定义
4.3 BEF值的性质探究
4.3.1 BEF值随聚类数目的变化趋势
4.3.2 不同相关系数下BEF值的稳定性
4.3.3 股票聚类的最佳数目
4.4 本章总结
第5章 总结和展望
5.1 本文总结
5.2 展望
参考文献
致谢
攻读硕士学位期间的研究成果
附录Ⅰ
附录Ⅱ
【参考文献】:
期刊论文
[1]一种基于DTW的新型股市时间序列相似性度量方法[J]. 冯钧,陈焕霖,唐志贤,吴德. 数据采集与处理. 2015(01)
[2]评价股票聚类的Ward权熵指标[J]. 王宁,荣喜民,何丽. 统计与信息论坛. 2015(01)
[3]基于近邻传播算法的最佳聚类数确定方法比较研究[J]. 周世兵,徐振源,唐旭清. 计算机科学. 2011(02)
博士论文
[1]聚类分析中的最佳聚类数确定方法研究及应用[D]. 周世兵.江南大学 2011
本文编号:3633858
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3633858.html