当前位置:主页 > 管理论文 > 移动网络论文 >

一种多模型集成的网络论坛流量预测模型

发布时间:2021-06-12 04:28
  论坛流量预测对网络规划、舆情管理等任务具有重要意义,针对线性预测模型无法预测非线性关系、非线性预测模型的特征工程过于复杂的问题,利用历史时间序列作为特征,建立一种基于不同算法的集成模型以预测论坛发帖量。运用差分自回归移动平均、长短期记忆神经网络、Prophet以及梯度提升决策树4种模型分别对时间序列进行预测,参照加权投票法的思想,各模型投票选出时间序列单位下密度较大的预测值区间,依据各模型预测值所处区间的密度大小对各预测值进行权重分配,然后通过加权平均得到最终的预测结果。实验结果表明,与算术平均模型、基于均方根误差的加权平均模型相比,该模型预测结果的RMSE值以及相对误差值更小。 

【文章来源】:计算机工程. 2020,46(12)北大核心CSCD

【文章页数】:8 页

【部分图文】:

一种多模型集成的网络论坛流量预测模型


集成模型流程

模型图,预测值,模型,区间


图2所示为5个子模型对2018年8月17日股吧论坛发帖量的预测值。从图2可以看出,当k值取28时,LSTM、Prophet以及GBDT 3个子模型的预测值位于同一区间且该区间为密度最大的区间,表明当日真实值最有可能位于此区间。因此,赋予这个区间的3个子模型预测值较大的权重,并对预测值不在该区间的ARIMA模型和算术平均模型赋予较小的权重,从而降低此时间尺度单位下ARIMA模型和算术平均模型预测值过小对最终结果产生的影响,提高预测精度。综上,本文集成模型算法描述如下:

时间序列,论坛,时间序列


本文实验数据集包含股吧论坛所有子论坛从2017年7月1日—2018年9月30日的每日发帖量数据,共457条。将2017年7月1日—2017年8月15日的发帖量作为测试集,依据不同的算法建立子模型以预测2017年8月16日—2018年9月28日的发帖量,并与实际情况相比较。股吧论坛发帖量的时间序列如图3所示,可以看出,股吧论坛发帖量的时间序列具有周和年2种周期性。在数据集预处理时对数据集中的缺失项进行中位数插值。此外,2018年9月27日与9月28日两天受国庆节放假影响,数据量偏高,因此,在分析结果时删除这2条异常数据。

【参考文献】:
期刊论文
[1]基于维度加权的残差LSTM短期交通流量预测[J]. 李月龙,唐德华,姜桂圆,肖志涛,耿磊,张芳,吴骏.  计算机工程. 2019(06)
[2]基于GMM-FMs的广告点击率预测研究[J]. 邓路佳,刘平山.  计算机工程. 2019(05)



本文编号:3225950

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3225950.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b8cce***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com