基于聚类线性回归的预测方法及其在股市预测上的应用
发布时间:2021-03-03 10:11
股市预测是一个比较具有挑战性的任务。由于受市场经济,企业运营,政治决策等多方面的因素影响,股市预测具有复杂,动态,不稳定性等特点。本文探讨了智能控制理论及模式识别中的重要方法,提出了基于聚类线性回归的预测模型,并将其应用到股市收盘价的预测上,数值结果表明新提出的预测算法可行有效。聚类线性回归结合了聚类和回归这两个典型的数据挖掘问题。一般聚类问题是以相似性作为依据对数据进行聚类,而聚类线性回归是以回归误差最小作为标准对数据进行聚类。本文对聚类线性回归的三个典型求解算法Sp?th算法,EM算法和基于非凸非光滑优化的算法进行讨论。为解决待预测点的归属问题,本文提出了一个使用多分类模型辅助待预测输入数据分类的聚类线性回归预测算法。算法的基本思想是首先根据聚类线性回归的结果训练出一个多分类模型,然后根据该多分类模型确定待预测输入应归属的聚类,最后运用该聚类所对应的线性回归系数进行预测。我们将新提出的预测算法的两个具体实现命名为Softmax-CLR和Softmax-CLR-weight。为了证明新提出的预测算法的有效性,本文将新提出的算法与现有的基于聚类线性回归的预测方法进行比较。数值比较结果表...
【文章来源】:西南科技大学四川省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
最优值在各内
?Whitewinequality这两个数据集的MAE和MARE都在Softmax-CLR算法取得,另两个指标CE和R2adj在Softmax-CLR-weight算法中取得.Concretecomp.str,Parkinsontele.(1st)和Parkinsontele.(2st)三个数据集的MARE最优值在Softmax-CLR算法中取得,MAE,CE,R2adj的最优值在Softmax-CLR-weight算法中取得。这说明,对于基于聚类线性回归的预测方法来说,最好还是能直接将待预测输入归属于某一个聚类,用单独一个聚类来预测,而不是用多个聚类取权重的方式来预测。表4-3中各个指标的最优值在6个对比算法中的占比统计在图4-2中。从图4-2可以看出70%的数据集中的最小平均绝对误差在Softmax-CLR算法中取得,生剩下的30%在Softmax-CLR-weight算法取得。这表明,对比预测算法中,用新提出的预测算法可以提高预测准确度。90%最小平均相对误差在Softmax-CLR算法取得,还有10%在近邻法处产生。相对误差能反应误差偏移量,这证明Softmax-CLR算法能够将算法误差控制在最小范围内。图4-2子图(c)能看出新算法的拟合效果好,比最大簇法,近邻法,权重法和距离法更好地拟合数据集。综上所述,新提出的预测算法比现有的基于聚类线性回归的预测算法准确度更高,这也是预测算法所追求的目标之一。(a)MAE(b)MARE(c)CE/R2adj图4-2最优值在各内部算法中的占比4.4.2基于回归的预测算法比较本小节将新提出的两种基于聚类线性回归的预测方法:Softmax-CLR算法和Softmax-CLR-weight算法与其他预测方法进行数值对比。用于对比的预测方法有线性回归预测,人工神经网络[21],岭回归[22]和逐步回归[24]。线性回归预测和聚类线性回归预测不同在于线性回归预测只使用单个线性函数,而聚类线性回归预测使用多个线性函数。从经验上来看,使用多个线性函数预测的方法?
最优值在各
【参考文献】:
期刊论文
[1]多元线性回归预测模型在农村生活垃圾产量预测中的应用[J]. 李海红,巩雪松,同帜. 西南农业学报. 2010(04)
本文编号:3061089
【文章来源】:西南科技大学四川省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
最优值在各内
?Whitewinequality这两个数据集的MAE和MARE都在Softmax-CLR算法取得,另两个指标CE和R2adj在Softmax-CLR-weight算法中取得.Concretecomp.str,Parkinsontele.(1st)和Parkinsontele.(2st)三个数据集的MARE最优值在Softmax-CLR算法中取得,MAE,CE,R2adj的最优值在Softmax-CLR-weight算法中取得。这说明,对于基于聚类线性回归的预测方法来说,最好还是能直接将待预测输入归属于某一个聚类,用单独一个聚类来预测,而不是用多个聚类取权重的方式来预测。表4-3中各个指标的最优值在6个对比算法中的占比统计在图4-2中。从图4-2可以看出70%的数据集中的最小平均绝对误差在Softmax-CLR算法中取得,生剩下的30%在Softmax-CLR-weight算法取得。这表明,对比预测算法中,用新提出的预测算法可以提高预测准确度。90%最小平均相对误差在Softmax-CLR算法取得,还有10%在近邻法处产生。相对误差能反应误差偏移量,这证明Softmax-CLR算法能够将算法误差控制在最小范围内。图4-2子图(c)能看出新算法的拟合效果好,比最大簇法,近邻法,权重法和距离法更好地拟合数据集。综上所述,新提出的预测算法比现有的基于聚类线性回归的预测算法准确度更高,这也是预测算法所追求的目标之一。(a)MAE(b)MARE(c)CE/R2adj图4-2最优值在各内部算法中的占比4.4.2基于回归的预测算法比较本小节将新提出的两种基于聚类线性回归的预测方法:Softmax-CLR算法和Softmax-CLR-weight算法与其他预测方法进行数值对比。用于对比的预测方法有线性回归预测,人工神经网络[21],岭回归[22]和逐步回归[24]。线性回归预测和聚类线性回归预测不同在于线性回归预测只使用单个线性函数,而聚类线性回归预测使用多个线性函数。从经验上来看,使用多个线性函数预测的方法?
最优值在各
【参考文献】:
期刊论文
[1]多元线性回归预测模型在农村生活垃圾产量预测中的应用[J]. 李海红,巩雪松,同帜. 西南农业学报. 2010(04)
本文编号:3061089
本文链接:https://www.wllwen.com/guanlilunwen/huobilw/3061089.html