基于EEMD和XGBoost算法的股票市场分析预测研究
发布时间:2020-12-10 19:08
我国股票市场作为实体企业筹集资金和各种类型的投资者配置自身资产的重要渠道,是我国金融市场不可缺少的重要组成部分。股票作为兼具高收益性和高风险性的金融资产,在金融市场的发展中有着举足轻重的地位,一直以来也受到金融市场各界人士的重视。然而股票数据是具有高复杂性,高数据量,高变化频率的金融时间序列,同时它具有高噪声、非线性、非平稳的特点,有悖于一些经典理论的基本假设,制约了经典理论的适用范围。因此,找到合理的股票市场数据的提取方法,构建一个能够描述股票市场复杂度非线性特点的模型,对于进一步揭示股票市场的内在运行规律,更好的发挥股票市场应有的功能,更加及时揭露金融风险等方面,都具有现实以及理论价值。时至今日,模型分析的方法已被广泛应用到金融行业的分析领域,其中比较经典的是ARMA、ARCH、GARCH等模型。这些方法都是以统计学基本原理为基础与依据,在时间序列满足平稳性假设或正态分布假设的前提下进行建模分析。这些分析方法仅从时间域这一方面做研究,其计算效率低,预测精度不足且研究层面单一。因此,经典预测模型已经很难适应现下对金融时间序列研究的需求。随着机器学习体系的建立以及其在实证分析研究中广泛...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图2.1:模态混叠效果图??
?山东大学硕士学位论文???原始数据集X??训练一?弱学习器F1?.??\?an.e??残差El??训练一?弱学习器F2?.?\??图2.2:?Boosting算法原理示意图??接下来,我们从数学形式的层面进行说明Boosting算法原理。机器学习的??主要组成部分是模型、参数和目标函数。应用于Boosting算法中,我们可以把??模型理解为多个弱学习器按照一定权重的组合;参数则反映模型的具体表现形??式,它是在算法学习的过程中确定的,变更参数等同于变更模型;而目标函数??是用于控制模型预测误差与模型复杂程度的,降低目标函数的大小是模型优化??的作用目标。??Boosting算法的模型可以表示成如下形式:??K??Vi?=?^2fk(xi),fk?e?F.??k=l??其中,F?==?{/(;r)?=?0^(2;)}表不弱学习器的集合。??目标函数由误差函数和复杂度函数两部分相加构成,我们可以表示成以下??形式:??Obj(y)?=?L(y)?+?n(y).??其中,⑷、L⑷和叫y)分别表示目标函数,误差函数和复杂度函数。??我们当然希望模型的能使预测值与真实值的损失项尽可能小,同时保证模??型的泛化能力。减小损失项可以通过最小化损失函数来实现,而泛化能力的保??—16?—??
?山东大学硕士学位论文???第三章深证综合指数EEMD分解??针对股票价格序列所表现的非线性、不平稳性、高噪声性特点,本章将选??择EEMD分解方法对深证综合指数日收盘价序列进行分解,重构,实现深证综??合指数的特征提取工作。经过EEMD分解重构,能够改善股票价格序列的非平??稳等复杂特征,同时提纯不同频率的具有现实经济意义的特征序列。??3.1数据来源与统计特征描述??股票指数作为描述股票市场总体价格水平波动的指标,其涵盖的股票市场??价格信息比单一股票更具有代表性,更能体现股票市场的宏观发展状况,对各??类投资者和研究人员都更具有借鉴价值。因此本文选择股票指数进行研宄。??本文的研究对象是深证综合指数,数据来源于大智慧360智能股票软件。??数据分析平台选择使用基于Python3.7的Jupyter?Notebook软件。研究数据选??择截取2018年1月5日至2019年12月29日深证综合指数的日收盘价以及开盘??价,最高价等基础数据作为实验研宄样本,共计487条数据。2018年1月5日??至2019年12月29日深证综合指数的日收盘价如图3.1所示。??:A??i:?V??i:?Vv??1200??.?,?,?.???.???图3.1:?2018-2019年深证综合指数日收盘价走势图??-21-??
【参考文献】:
期刊论文
[1]Forecasting Method of Stock Market Volatility in Time Series Data Based on Mixed Model of ARIMA and XGBoost[J]. Yan Wang,Yuankai Guo. 中国通信. 2020(03)
[2]改进的XGBoost模型在股票预测中的应用[J]. 王燕,郭元凯. 计算机工程与应用. 2019(20)
[3]皮尔森优化结合Xgboost算法的股价预测研究[J]. 陈宇韶,唐振军,罗扬,杨洁. 信息技术. 2018(09)
[4]基于EEMD-LSTM-Adaboost的商品价格预测[J]. 邸浩,赵学军,张自力. 统计与决策. 2018(13)
[5]机器学习方法在股指期货预测中的应用研究——基于BP神经网络、SVM和XGBoost的比较分析[J]. 黄卿,谢合亮. 数学的实践与认识. 2018(08)
[6]GBDT组合模型在股票预测中的应用[J]. 张潇,韦增欣,杨天山. 海南师范大学学报(自然科学版). 2018(01)
[7]股指期货是股灾的“幕后推手”吗——基于2015年股灾期间沪深300股指期货高频数据实证分析[J]. 杨林,杨雅如. 财经理论与实践. 2017(03)
[8]XGBoost算法在电子商务商品推荐中的应用[J]. 张昊,纪宏超,张红宇. 物联网技术. 2017(02)
[9]基于经验模态分解的上证综合指数时间序列分析[J]. 蔡赟姝,卢志明. 上海大学学报(自然科学版). 2012(04)
[10]基于EMD的时间序列不同频率波动及趋势研究[J]. 史美景,曹星婉. 统计与决策. 2012(16)
博士论文
[1]基于EMD分解技术的不同市场原油价格相关性分析及预测研究[D]. 杨云飞.华中科技大学 2011
本文编号:2909225
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图2.1:模态混叠效果图??
?山东大学硕士学位论文???原始数据集X??训练一?弱学习器F1?.??\?an.e??残差El??训练一?弱学习器F2?.?\??图2.2:?Boosting算法原理示意图??接下来,我们从数学形式的层面进行说明Boosting算法原理。机器学习的??主要组成部分是模型、参数和目标函数。应用于Boosting算法中,我们可以把??模型理解为多个弱学习器按照一定权重的组合;参数则反映模型的具体表现形??式,它是在算法学习的过程中确定的,变更参数等同于变更模型;而目标函数??是用于控制模型预测误差与模型复杂程度的,降低目标函数的大小是模型优化??的作用目标。??Boosting算法的模型可以表示成如下形式:??K??Vi?=?^2fk(xi),fk?e?F.??k=l??其中,F?==?{/(;r)?=?0^(2;)}表不弱学习器的集合。??目标函数由误差函数和复杂度函数两部分相加构成,我们可以表示成以下??形式:??Obj(y)?=?L(y)?+?n(y).??其中,⑷、L⑷和叫y)分别表示目标函数,误差函数和复杂度函数。??我们当然希望模型的能使预测值与真实值的损失项尽可能小,同时保证模??型的泛化能力。减小损失项可以通过最小化损失函数来实现,而泛化能力的保??—16?—??
?山东大学硕士学位论文???第三章深证综合指数EEMD分解??针对股票价格序列所表现的非线性、不平稳性、高噪声性特点,本章将选??择EEMD分解方法对深证综合指数日收盘价序列进行分解,重构,实现深证综??合指数的特征提取工作。经过EEMD分解重构,能够改善股票价格序列的非平??稳等复杂特征,同时提纯不同频率的具有现实经济意义的特征序列。??3.1数据来源与统计特征描述??股票指数作为描述股票市场总体价格水平波动的指标,其涵盖的股票市场??价格信息比单一股票更具有代表性,更能体现股票市场的宏观发展状况,对各??类投资者和研究人员都更具有借鉴价值。因此本文选择股票指数进行研宄。??本文的研究对象是深证综合指数,数据来源于大智慧360智能股票软件。??数据分析平台选择使用基于Python3.7的Jupyter?Notebook软件。研究数据选??择截取2018年1月5日至2019年12月29日深证综合指数的日收盘价以及开盘??价,最高价等基础数据作为实验研宄样本,共计487条数据。2018年1月5日??至2019年12月29日深证综合指数的日收盘价如图3.1所示。??:A??i:?V??i:?Vv??1200??.?,?,?.???.???图3.1:?2018-2019年深证综合指数日收盘价走势图??-21-??
【参考文献】:
期刊论文
[1]Forecasting Method of Stock Market Volatility in Time Series Data Based on Mixed Model of ARIMA and XGBoost[J]. Yan Wang,Yuankai Guo. 中国通信. 2020(03)
[2]改进的XGBoost模型在股票预测中的应用[J]. 王燕,郭元凯. 计算机工程与应用. 2019(20)
[3]皮尔森优化结合Xgboost算法的股价预测研究[J]. 陈宇韶,唐振军,罗扬,杨洁. 信息技术. 2018(09)
[4]基于EEMD-LSTM-Adaboost的商品价格预测[J]. 邸浩,赵学军,张自力. 统计与决策. 2018(13)
[5]机器学习方法在股指期货预测中的应用研究——基于BP神经网络、SVM和XGBoost的比较分析[J]. 黄卿,谢合亮. 数学的实践与认识. 2018(08)
[6]GBDT组合模型在股票预测中的应用[J]. 张潇,韦增欣,杨天山. 海南师范大学学报(自然科学版). 2018(01)
[7]股指期货是股灾的“幕后推手”吗——基于2015年股灾期间沪深300股指期货高频数据实证分析[J]. 杨林,杨雅如. 财经理论与实践. 2017(03)
[8]XGBoost算法在电子商务商品推荐中的应用[J]. 张昊,纪宏超,张红宇. 物联网技术. 2017(02)
[9]基于经验模态分解的上证综合指数时间序列分析[J]. 蔡赟姝,卢志明. 上海大学学报(自然科学版). 2012(04)
[10]基于EMD的时间序列不同频率波动及趋势研究[J]. 史美景,曹星婉. 统计与决策. 2012(16)
博士论文
[1]基于EMD分解技术的不同市场原油价格相关性分析及预测研究[D]. 杨云飞.华中科技大学 2011
本文编号:2909225
本文链接:https://www.wllwen.com/guanlilunwen/huobilw/2909225.html