基于Spark增量聚类的投资组合推荐系统的研究与实现
发布时间:2020-05-24 02:17
【摘要】:“互联网+”时代的到来使得互联网金融业千帆竞发,投资大众化热潮兴起,居民的消费和投资观念发生了翻天覆地的变化。近年来,新开户股民数量急剧上升,但中国股市动荡,投资风险高,散户能够获得的有效信息很少。由于股票市场的高复杂性和影响股票市场的因素较多,如何为股民提供可靠的信息,如何判断上市公司的内在投资价值,如何选择出优质股和潜力股,组成投资组合,以降低股民的投资风险,具有巨大的研究价值。本文针对以上问题,深入调研了选股和投资组合方法,将基本面分析选股法和聚类分析选股法相结合,提出自己的投资组合推荐策略。针对本文研究的带有全局变化特征的增量数据,设计实现了一种基于Spark分布式平台的增量聚类算法,并对历年所有上市公司的财务数据进行仿真实验,设计出一款投资组合推荐系统,应用于实际。首先,本文深入调研了选股和投资组合方法,将基本面分析选股法和聚类分析选股法相结合,提出自己的投资组合推荐策略。根据基本面分析法,研究公司财务数据特征和财务报表指标,提取出能反映公司盈利能力、成长能力、运营能力、偿债能力的20个基本指标,作为增量聚类的特征数据。其次,深入分析金融时间序列数据特点,对增量数据的格式进行详细阐述。本课题研究的数据是带有全局变化特征的增量数据,对于全局变化数据的处理,提出增量极差归一化-金字塔时间模型,对于数据点不断增加的处理,提出增量Kmeans算法,并将两种算法结合,在Spark分布式平台实现增量聚类算法模型,实验论证,该增量聚类算法比传统Kmeans的聚类效果更好。最后,运用Java Web设计实现一款投资组合推荐系统。该系统的主要功能包括公司综合能力评估和最优投资组合推荐。在20个基本指标基础上,结合因子分析法,对公司综合能力进行评分;在增量聚类得出的结果之上,每个簇内利用主成分分析法选出主成分再进行排序,选出最好的一支股票作为优质股,将不同簇选出的优质股组成最优投资组合股票池,并对系统推荐的最优投资组合进行86天的股票数据回测,回测结果显示,推荐的股票收益率表现良好,能够为股民投资决策提供重要信息。对该系统进行功能、性能、界面方面的测试,测试结果表明,该系统运行良好。
【图文】:
图 1-1 投资组合方法汇总图Fig. 1-1 A summary diagram of the portfolio approach增量聚类的研究现状数据最重要的特征之一是在现有已经存在的大量数据基础上,数据持续地扩展。许多领域数据量惊人的同时,还在不断地生成新数据监控、金融交易管理、网络流监视和web信息处理等。数据集增量式],,其内容与分布情况也在不断地动态更新[32],聚类的结果总是随着而改变。每次任何新数据到达时,从头开始聚类所有数据虽然直截现实。增量聚类是解决增量式数据集的重要方法。显然,对于不断,最好在原始聚类结果的基础上逐步更新新增数据点的所属簇,而有数据整体聚类,尝试最小化原有数据点的扫描和计算工作,有效现有聚类结果是非常重要的。传统的聚类算法是为了解决静态数据
推荐的股票收益率表现良好,能够为股民投资决策提供重要信息。对该系统进行功能、性能、界面方面的测试,测试结果表明,该系统运行良好。本论文研究的技术路线图如下图1-2:
【学位授予单位】:黑龙江大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F832.51;TP311.13;TP391.3
【图文】:
图 1-1 投资组合方法汇总图Fig. 1-1 A summary diagram of the portfolio approach增量聚类的研究现状数据最重要的特征之一是在现有已经存在的大量数据基础上,数据持续地扩展。许多领域数据量惊人的同时,还在不断地生成新数据监控、金融交易管理、网络流监视和web信息处理等。数据集增量式],,其内容与分布情况也在不断地动态更新[32],聚类的结果总是随着而改变。每次任何新数据到达时,从头开始聚类所有数据虽然直截现实。增量聚类是解决增量式数据集的重要方法。显然,对于不断,最好在原始聚类结果的基础上逐步更新新增数据点的所属簇,而有数据整体聚类,尝试最小化原有数据点的扫描和计算工作,有效现有聚类结果是非常重要的。传统的聚类算法是为了解决静态数据
推荐的股票收益率表现良好,能够为股民投资决策提供重要信息。对该系统进行功能、性能、界面方面的测试,测试结果表明,该系统运行良好。本论文研究的技术路线图如下图1-2:
【学位授予单位】:黑龙江大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F832.51;TP311.13;TP391.3
【相似文献】
相关期刊论文 前10条
1 黄清华;胡波;钟伟;陈磊;石元杰;;Effects of background pressure on the arc characteristics of gas spark gap[J];Plasma Science and Technology;2019年12期
2 邓伟;;SPARK课程理念下的我国篮球教学课程构建[J];运动精品;2019年10期
3 孙建顺;;基于SPARK课程理念优化足球教学的实践探索——以小学足球正脚背运球为例[J];教学月刊小学版(综合);2017年09期
4 陈虹君;谢彩云;;基于Spark的大数据实验室建设的研究与实施[J];教育现代化;2016年37期
5 余涛;刘泽q
本文编号:2678303
本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/2678303.html