基于统计学方法的互联网企业运营指标异常值监控及预警模型
发布时间:2017-12-25 16:26
本文关键词:基于统计学方法的互联网企业运营指标异常值监控及预警模型 出处:《华东师范大学》2017年硕士论文 论文类型:学位论文
更多相关文章: 异常检测 季节乘积ARIMA 局部异常因子 节假日模式识别
【摘要】:随着互联网电商的兴起,越来越多的人使用互联网购物。互联网企业依托强大的计算机技术,每天会收集到庞大的用户行为数据。对于互联网企业运营团队而言,数据爆炸带来的困扰时刻影响着他们的决断。本文站在互联网企业运营团队角度,把时间序列模型和均值-极差等统计技术用于异常值检测及指标监控。不同于金融行业欺诈模型以及医学领域中的异常值甄别,本文主要关注点为企业级指标每天是否异于过去平均情况,若与过去平均状况偏差较大则自动报警提示。本文首先使用正态分布的一元离群点检验方法、非参数分析的箱形图和非监督学习的局部异常因子法对训练数据中的异常值做检测,然后运用异常值同期均值或增长率趋势进行插补,接着将配对T检验创造性地用于节假日模式识别,进而将训练数据集分成节假日和非节假日。对于非节假日数据,通过季节乘积ARIMA模型、三次指数平滑进行拟合并计算一期95%预测上下限,结合均值-极差质量监控图得出最终的预测值上下限。对于节假日数据,通过研究节假日真实数据与季节乘积ARIMA模型预测值之差所形成的序列,运用傅立叶谱分析进行拟合。最后将非节假日时期模型和节假日时期模型通过示性函数累加,得出该指标在整个时期的预测模型。若某指标当天数值超出了预测上下限则显示异常。实证分析中,本文重点分析某互联网旅游企业转化率指标。通过配对T检验得出该指标在国庆节前12天至节后6天具有明显的节假日效应,其模式为节前升高、节中降低、节后又升高的"U"型效应。通过异常点检测技术找出了 5个训练数据集中的异常点,并进行有效地插值,通过业务实践证明其插值效果和真实情况非常接近。随后建立了季节乘积ARIMA模型和三次指数平滑模型,通过样本内(外)均方误最终选用了季节乘积ARIMA模型,结合均值-极差质量监控图得到了非节假日预测模型,样本外均方误为7.78E-8。最后对国庆节影响数值研究,得到了双周期傅立叶谱分析模型。运用示性函数整合两部分得出最终的监控模型。通过实证分析和实际工作应用,异常值识别率在三个月内接近100%,有效地解决了实际工作中的现实问题。
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:F224;F49
【参考文献】
相关期刊论文 前5条
1 韩晓龙;;基于Holt-Winters方法对GDP水平预测方法的比较[J];企业导报;2015年05期
2 徐婷;李选海;郭昶;;ARIMA乘积季节模型对我国消费者信心指数的分析[J];科技信息;2012年19期
3 王骏;王士同;邓赵红;;聚类分析研究中的若干问题[J];控制与决策;2012年03期
4 张卫旭;尉宇;;基于密度的局部离群点检测算法[J];计算机与数字工程;2010年10期
5 章晓;;时间序列异常值影响估计的探讨[J];山东师范大学学报(自然科学版);2009年01期
相关硕士学位论文 前1条
1 甘宏;季节时间序列的方法研究及实证分析[D];电子科技大学;2011年
,本文编号:1333570
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/1333570.html