k均值聚类优化及其在基金投资中的应用
发布时间:2024-03-13 05:19
随着大数据的发展,数据分析、数据挖掘等创新技术已经在众多学科领域中得到了广泛运用。聚类分析是我们在实践中运用非常多的一种无监督数据挖掘类算法。而k均值聚类算法是日常中使用频率最多的聚类型算法,但是k均值聚类算法也同样有其缺点:首先算法很可能陷入局部最优,难以实现想要的聚类效果,初始聚类中心的选取肯定会影响到聚类的最终结果,不一样的初始中心肯定会是不一样的呈现,可能达不到理想的聚类结果;其次k值的选取很难确定,k均值聚类需要我们提前决定最终的聚类个数,聚类数值不同必然造成的聚类结果也会不同。本文对k均值聚类的研究探讨主要是两方面:一是如何确定聚类的数目;二是如何选择初始聚类中心。针对k值本文总结运用了手肘法、Mclust、PAM、Nbclust等四种方法来确定k值,综合四种方法结合实际问题情况分析结果,最终能很好地得出k值,消除了很多主观因素;针对初始聚类中心的选择,本文提出将k-means++算法中采用随机原则选第一个初始聚类中心这一步改为第一个初始聚类中心确定性选取为离全局中心最远的点。而剩下k-1个按距离越远越好的原则选取。即先得到所有数据点与最近聚类中心的距离D(x)(也就是算出...
【文章页数】:46 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪言
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文主要研究内容
1.4 论文组织结构
2 理论准备
2.1 k均值聚类算法
2.2 k-means++算法
2.3 k值确定法
2.4 本章小结
3 改进算法
3.1 改进算法思路
3.2 本章小结
4 实验研究
4.1 指标筛选与数据预处理
4.2 确定k值
4.3 算法实现及评估
4.4 本章小结
5 收益回测
6 基金投资扩展
7 总结与展望
7.1 总结
7.2 展望
致谢
参考文献
附录
本文编号:3927249
【文章页数】:46 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪言
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文主要研究内容
1.4 论文组织结构
2 理论准备
2.1 k均值聚类算法
2.2 k-means++算法
2.3 k值确定法
2.4 本章小结
3 改进算法
3.1 改进算法思路
3.2 本章小结
4 实验研究
4.1 指标筛选与数据预处理
4.2 确定k值
4.3 算法实现及评估
4.4 本章小结
5 收益回测
6 基金投资扩展
7 总结与展望
7.1 总结
7.2 展望
致谢
参考文献
附录
本文编号:3927249
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/3927249.html