基于LightGBM算法的股指涨跌预测方案
发布时间:2021-10-24 05:05
一直以来金融时间序列的预测问题都是投资者和学者的研究重点,但股市受多种复杂因素影响,预测难度较大。随着计算机技术的发展,越来越多的机器学习方法应用于金融时间序列的预测问题中,尤其在股票价格指数涨跌预测中具有很强的适用性。本文以LightGBM算法为基础构建股票指数涨跌预测模型,对沪深300指数和中证500指数的涨跌进行预测,选取12个技术指标作为输入特征,第二天的涨跌作为输出变量。同时,为了优化模型的预测效果,运用逻辑回归联合LightGBM算法的方法,构建LR-LightGBM模型对两个股指进行预测,利用网格搜索法对算法中的参数进行寻优,比较上述两个模型的预测效果。本文选取2012年1月1日至2019年12月31日的交易日数据进行实证研究,结果显示上述预测模型对股指涨跌的预测均有较好的适用性,对于沪深300指数的预测效果较好,并且逻辑回归有助于提高LightGBM模型的预测准确率。然后基于LightGBM模型和LR-LightGBM模型的预测结果,构建量化择时策略,以嘉实沪深300ETF为交易对象进行回测。从风险和收益方面,综合比较两个模型,发现基于LR-LightGBM模型的股指涨...
【文章来源】:上海师范大学上海市
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数分布图
上海师范大学硕士学位论文第4章基于LightGBM算法的股指涨跌预测方案设计31令TP、FP、TN、FN分别表示上述四种情况的实例的数量,样本总数等于上述四种情况数量之和。二分类结果的混淆矩阵如表4.2所示:表4.2分类结果的混淆矩阵真实情况预测结果正例反例正例TP(真正例)FN(假反例)反例FP(假正例)TN(真反例)准确率(accuracy)和F1值是常用来度量分类结果,F1值是由精准率与召回率调和计算得到,F1值距离精准率与召回率中较小的值更近。计算公式如下(4-11)至(4-14)所示:准确率(accuracy)=TPTNTPFNFPTN(4-11)精准率(precison)=TPTPFP(4-12)召回率(recall)=TPTPFN(4-13)2**1precisionrecallFprecisionrecall(4-14)ROC曲线是常用的二分类模型评估标准,AUC(AreaUnderCurve)被定义为ROC曲线下的面积,数值不大于1。ROC曲线横轴为负正类率(FPR),即分类器模型所分的正例中的本来为负例与所有负例之比,纵轴为真正类率(TPR),即分类器模型所分的正例中本来的正例与所有正例之比。AUC值越大的分类模型,正确率越高。如图4.7所示,ROC曲线越靠近左上角,AUC值越大,模型精度越高。图4.7ROC曲线图
上海师范大学硕士学位论文第4章基于LightGBM算法的股指涨跌预测方案设计33图4.8沪深300指数模型ROC曲线(左)和中证500指数模型ROC曲线(右)然后利用逻辑回归联合LightGBM算法,构建LR-LightGBM模型,同样输入12个连续技术指标,并分别预测沪深300指数和中证500指数的涨跌,最优参数取值和预测结果如下表4.5所示。表4.5LR-LightGBM模型的参数取值参数名称参数取值沪深300中证500max_depth77num_leaves2030learning_rate0.10.1feature_fraction0.80.8bagging_fraction0.80.8num_iterations20202从表4.6列出的预测结果可知,与LightGBM模型相比,LR-LightGBM模型预测效果更好,F1值和准确率提高明显。其中,沪深300指数的预测精度提高3.4%左右,中证500指数的预测精度提高1.5%左右,说明联合逻辑回归可以在一定程度上优化LightGBM模型的预测精度。表4.6LR-LightGBM模型预测结果预测结果沪深300中证500F1值0.57280.5419准确率0.57290.5523下图4.9中展示了LR-LightGBM模型预测两个指数的ROC曲线,AUC值分别为0.5840和0.5660,与LightGBM模型的AUC值相比均有所增加,再次印证LR-LightGBM模型的分类效果优于LightGBM模型。将逻辑回归模型的预测得分与技术指标一起输入LightGBM训练,提供了更多关于股指趋势变动的信息,有助于提高预测模型的预测精度并且可以防止过拟合。此外,综合两个模型预测结果的F1值、准确率和AUC值可知,模型预测沪深300指数涨跌的效果略高于中证
【参考文献】:
期刊论文
[1]基于机器学习的股票超额收益预测模型[J]. 蔡清权,马雲匀,李金妹. 信息系统工程. 2019(09)
[2]股票市场短期趋势的离散分类预测模型研究[J]. 李缃珍. 经济研究导刊. 2019(26)
[3]茅台股价一路走红的基本面分析[J]. 刘涛. 中国集体经济. 2018(28)
[4]基于偏最小二乘方法的ARIMA模型在股票指数预测中的应用[J]. 方坷昊,赵凌. 四川文理学院学报. 2018(05)
[5]基于EMD和ARMA模型的上证指数预测[J]. 吴振宇,喻敏,金吉,姜楠. 中国商论. 2018(16)
[6]GBDT组合模型在股票预测中的应用[J]. 张潇,韦增欣,杨天山. 海南师范大学学报(自然科学版). 2018(01)
[7]基于ARIMA模型对上证指数趋势的预测[J]. 李晓先. 辽宁经济. 2017(07)
[8]基于C4.5决策树的股票数据挖掘[J]. 王领,胡扬. 计算机与现代化. 2015(10)
[9]基于ARIMA模型对上证指数月度时间序列的分析和预测[J]. 崔远远,文忠桥. 枣庄学院学报. 2015(02)
[10]兼顾基本面与估值指标的价值投资策略实证研究——来自2000-2013年中国沪深A股市场的经验数据[J]. 姚辉,武婷婷. 投资研究. 2014(11)
本文编号:3454633
【文章来源】:上海师范大学上海市
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数分布图
上海师范大学硕士学位论文第4章基于LightGBM算法的股指涨跌预测方案设计31令TP、FP、TN、FN分别表示上述四种情况的实例的数量,样本总数等于上述四种情况数量之和。二分类结果的混淆矩阵如表4.2所示:表4.2分类结果的混淆矩阵真实情况预测结果正例反例正例TP(真正例)FN(假反例)反例FP(假正例)TN(真反例)准确率(accuracy)和F1值是常用来度量分类结果,F1值是由精准率与召回率调和计算得到,F1值距离精准率与召回率中较小的值更近。计算公式如下(4-11)至(4-14)所示:准确率(accuracy)=TPTNTPFNFPTN(4-11)精准率(precison)=TPTPFP(4-12)召回率(recall)=TPTPFN(4-13)2**1precisionrecallFprecisionrecall(4-14)ROC曲线是常用的二分类模型评估标准,AUC(AreaUnderCurve)被定义为ROC曲线下的面积,数值不大于1。ROC曲线横轴为负正类率(FPR),即分类器模型所分的正例中的本来为负例与所有负例之比,纵轴为真正类率(TPR),即分类器模型所分的正例中本来的正例与所有正例之比。AUC值越大的分类模型,正确率越高。如图4.7所示,ROC曲线越靠近左上角,AUC值越大,模型精度越高。图4.7ROC曲线图
上海师范大学硕士学位论文第4章基于LightGBM算法的股指涨跌预测方案设计33图4.8沪深300指数模型ROC曲线(左)和中证500指数模型ROC曲线(右)然后利用逻辑回归联合LightGBM算法,构建LR-LightGBM模型,同样输入12个连续技术指标,并分别预测沪深300指数和中证500指数的涨跌,最优参数取值和预测结果如下表4.5所示。表4.5LR-LightGBM模型的参数取值参数名称参数取值沪深300中证500max_depth77num_leaves2030learning_rate0.10.1feature_fraction0.80.8bagging_fraction0.80.8num_iterations20202从表4.6列出的预测结果可知,与LightGBM模型相比,LR-LightGBM模型预测效果更好,F1值和准确率提高明显。其中,沪深300指数的预测精度提高3.4%左右,中证500指数的预测精度提高1.5%左右,说明联合逻辑回归可以在一定程度上优化LightGBM模型的预测精度。表4.6LR-LightGBM模型预测结果预测结果沪深300中证500F1值0.57280.5419准确率0.57290.5523下图4.9中展示了LR-LightGBM模型预测两个指数的ROC曲线,AUC值分别为0.5840和0.5660,与LightGBM模型的AUC值相比均有所增加,再次印证LR-LightGBM模型的分类效果优于LightGBM模型。将逻辑回归模型的预测得分与技术指标一起输入LightGBM训练,提供了更多关于股指趋势变动的信息,有助于提高预测模型的预测精度并且可以防止过拟合。此外,综合两个模型预测结果的F1值、准确率和AUC值可知,模型预测沪深300指数涨跌的效果略高于中证
【参考文献】:
期刊论文
[1]基于机器学习的股票超额收益预测模型[J]. 蔡清权,马雲匀,李金妹. 信息系统工程. 2019(09)
[2]股票市场短期趋势的离散分类预测模型研究[J]. 李缃珍. 经济研究导刊. 2019(26)
[3]茅台股价一路走红的基本面分析[J]. 刘涛. 中国集体经济. 2018(28)
[4]基于偏最小二乘方法的ARIMA模型在股票指数预测中的应用[J]. 方坷昊,赵凌. 四川文理学院学报. 2018(05)
[5]基于EMD和ARMA模型的上证指数预测[J]. 吴振宇,喻敏,金吉,姜楠. 中国商论. 2018(16)
[6]GBDT组合模型在股票预测中的应用[J]. 张潇,韦增欣,杨天山. 海南师范大学学报(自然科学版). 2018(01)
[7]基于ARIMA模型对上证指数趋势的预测[J]. 李晓先. 辽宁经济. 2017(07)
[8]基于C4.5决策树的股票数据挖掘[J]. 王领,胡扬. 计算机与现代化. 2015(10)
[9]基于ARIMA模型对上证指数月度时间序列的分析和预测[J]. 崔远远,文忠桥. 枣庄学院学报. 2015(02)
[10]兼顾基本面与估值指标的价值投资策略实证研究——来自2000-2013年中国沪深A股市场的经验数据[J]. 姚辉,武婷婷. 投资研究. 2014(11)
本文编号:3454633
本文链接:https://www.wllwen.com/guanlilunwen/huobilw/3454633.html