基于数据分析的云服务运营支撑系统的设计与实现
发布时间:2020-11-02 05:10
随着云计算服务商业价值的日益增长,互联网企业纷纷研发并推出各自的公有云服务平台。面向多用户的公有云服务,相较于私有云和混合云等类型的服务而言,其特点是由云服务提供商来保证云计算资源和服务的安全性和可用性,并负责云服务平台的运营工作。为提升运营工作的效率,云服务提供商们依据各自的运营方式和营销策略定制相应的运营支撑系统。为解决传统运营所存在的模式单一、无法动态调整的问题,基于数据分析的运营支撑系统的设计与研发成为了一种发展趋势,本文的研究目的是利用数据分析技术实现精细化和高效化运营,以提升云服务产品竞争力。本论文在详细分析云服务运营支撑的业务需求、功能需求及非功能需求的基础上,完成集成数据分析服务、用户管理服务、产品管理服务以及管理员管理服务四项基本功能的云服务运营支撑系统的设计与实现工作。根据系统需求,本文给出了基于B/S架构模式的系统架构设计方案,以及基于分层和模块化思想的服务器端设计方案,并采用Spring MVC、Spring、My Batis、My SQL等技术实现了一个高可用、易扩展的云服务运营支撑系统。针对作为系统核心的数据分析服务,本文介绍了基于数据分析技术的设计和实现方案。其中,将统计分析和数据可视化技术应用于用户基本画像分析,有效地实现了用户各维度信息的分析和展示。将数据挖掘技术中的K-means聚类分析算法用于用户分群分析的实现,并针对传统聚类分析算法的不足及实际业务场景应用的数据特点,提出了相应的优化和改进方案,使得分析结果更具备决策参考价值。另外,本文通过设计实现用户消费余额预警服务较好地解决了云服务用户因欠费导致云服务资源被回收的问题,同时建立了用户欠费预测模型,可有效预测识别存在恶意欠费风险的用户,避免资源被恶意占用。最后,本文对所实现的基于数据分析的运营支撑系统进行了功能测试和非功能测试,结果表明系统能提供预期功能服务,且满足高可用、高可靠、易扩展的性能需求,达到了预期设计要求。
【学位单位】:哈尔滨工业大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP311.52
【部分图文】:
将经过数据预处理后的数据集作为模型的输入项,执行聚类为该聚类分析模型的使用场景是未知真实分组情况,所以对于模的评估本文采用内部法,使用特征向量计算内平方和(Within Ses,WSS)的计算结果作为具体的评价指标。实验中输入数据集的m ,每个数据点所对应的变量数为n ,可得 WSS 的定义公式如下2 ( ) 21 1 1( , ) ( )m m ni ii ij ji i jWSS d p q p q (中,1 2( , ,..., )i i i inp p p p表示第 i 个数据点的特征向量,1 2( , ,..i i i q q q i个数据点所在聚类的中心点的特征向量。SS 指标可衡量相同聚类内部数据点之间的不相似程度,其计算值类效果越好。随着聚类数目的增多,WSS 值将逐渐减小,而当聚际数目时,随着聚类数目的增多,WSS 值以较快速度下降,而当实际数目时,随着聚类数目的增多,WSS 值下降速度减缓。采用目作为输入,得到 WSS 值随聚类数目变化趋势如图 3-4 所示。
将经过数据预处理后的数据集作为模型的输入项,执行聚类为该聚类分析模型的使用场景是未知真实分组情况,所以对于模的评估本文采用内部法,使用特征向量计算内平方和(Within Ses,WSS)的计算结果作为具体的评价指标。实验中输入数据集的m ,每个数据点所对应的变量数为n ,可得 WSS 的定义公式如下2 ( ) 21 1 1( , ) ( )m m ni ii ij ji i jWSS d p q p q (中,1 2( , ,..., )i i i inp p p p表示第 i 个数据点的特征向量,1 2( , ,..i i i q q q i个数据点所在聚类的中心点的特征向量。SS 指标可衡量相同聚类内部数据点之间的不相似程度,其计算值类效果越好。随着聚类数目的增多,WSS 值将逐渐减小,而当聚际数目时,随着聚类数目的增多,WSS 值以较快速度下降,而当实际数目时,随着聚类数目的增多,WSS 值下降速度减缓。采用目作为输入,得到 WSS 值随聚类数目变化趋势如图 3-4 所示。
哈尔滨工业大学工程硕士学位论文对比实验的模型算法参数设置,如表 3-2 所示:表 3-2 模型性能优化对比实验参数设置参数名 参数值 说明FEATURE_NUM 5 模型输入变量数MAX_ITERATIONS 500 最大迭代次数DISTANCE_MEASURE EUCLIDEAN_DISTANCE 距离度量PTY_CLUSTER_STATEGY LARGEST_VARIANCE 空类处理策略NUM_TRIALS 100 重复聚类次数K [2,3,4,5,6,7,8,9] 聚类数目在上述模型参数设置的条件下,以相同的数据集作为特征变量输入,2, 9]范围内的数目作为聚类变量输入,分别应用未优化和优化eans++算法进行聚类分析,将分析处理所耗时间作为分析结果输出,结果如图 3-5 所示。
【参考文献】
本文编号:2866615
【学位单位】:哈尔滨工业大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP311.52
【部分图文】:
将经过数据预处理后的数据集作为模型的输入项,执行聚类为该聚类分析模型的使用场景是未知真实分组情况,所以对于模的评估本文采用内部法,使用特征向量计算内平方和(Within Ses,WSS)的计算结果作为具体的评价指标。实验中输入数据集的m ,每个数据点所对应的变量数为n ,可得 WSS 的定义公式如下2 ( ) 21 1 1( , ) ( )m m ni ii ij ji i jWSS d p q p q (中,1 2( , ,..., )i i i inp p p p表示第 i 个数据点的特征向量,1 2( , ,..i i i q q q i个数据点所在聚类的中心点的特征向量。SS 指标可衡量相同聚类内部数据点之间的不相似程度,其计算值类效果越好。随着聚类数目的增多,WSS 值将逐渐减小,而当聚际数目时,随着聚类数目的增多,WSS 值以较快速度下降,而当实际数目时,随着聚类数目的增多,WSS 值下降速度减缓。采用目作为输入,得到 WSS 值随聚类数目变化趋势如图 3-4 所示。
将经过数据预处理后的数据集作为模型的输入项,执行聚类为该聚类分析模型的使用场景是未知真实分组情况,所以对于模的评估本文采用内部法,使用特征向量计算内平方和(Within Ses,WSS)的计算结果作为具体的评价指标。实验中输入数据集的m ,每个数据点所对应的变量数为n ,可得 WSS 的定义公式如下2 ( ) 21 1 1( , ) ( )m m ni ii ij ji i jWSS d p q p q (中,1 2( , ,..., )i i i inp p p p表示第 i 个数据点的特征向量,1 2( , ,..i i i q q q i个数据点所在聚类的中心点的特征向量。SS 指标可衡量相同聚类内部数据点之间的不相似程度,其计算值类效果越好。随着聚类数目的增多,WSS 值将逐渐减小,而当聚际数目时,随着聚类数目的增多,WSS 值以较快速度下降,而当实际数目时,随着聚类数目的增多,WSS 值下降速度减缓。采用目作为输入,得到 WSS 值随聚类数目变化趋势如图 3-4 所示。
哈尔滨工业大学工程硕士学位论文对比实验的模型算法参数设置,如表 3-2 所示:表 3-2 模型性能优化对比实验参数设置参数名 参数值 说明FEATURE_NUM 5 模型输入变量数MAX_ITERATIONS 500 最大迭代次数DISTANCE_MEASURE EUCLIDEAN_DISTANCE 距离度量PTY_CLUSTER_STATEGY LARGEST_VARIANCE 空类处理策略NUM_TRIALS 100 重复聚类次数K [2,3,4,5,6,7,8,9] 聚类数目在上述模型参数设置的条件下,以相同的数据集作为特征变量输入,2, 9]范围内的数目作为聚类变量输入,分别应用未优化和优化eans++算法进行聚类分析,将分析处理所耗时间作为分析结果输出,结果如图 3-5 所示。
【参考文献】
相关期刊论文 前6条
1 刘海;卢慧;阮金花;田丙强;胡守忠;;基于“用户画像”挖掘的精准营销细分模型研究[J];丝绸;2015年12期
2 张静;;数据挖掘中聚类分析综述[J];价值工程;2014年15期
3 刘化召;陈学锋;俞前;;融合IDC运营支撑系统设计与分析[J];电信科学;2013年01期
4 薛峰;梁锋;徐书勋;王彪任;;基于Spring MVC框架的Web研究与应用[J];合肥工业大学学报(自然科学版);2012年03期
5 傅德胜;周辰;;基于密度的改进K均值算法及实现[J];计算机应用;2011年02期
6 许晓冯;;浅谈云计算及其应用[J];信息化研究;2010年11期
相关硕士学位论文 前3条
1 谭亮;一种公共云计算平台的设计及云计算任务分派算法研究[D];华东理工大学;2013年
2 赵楠明;网游客户分群与特征挖掘算法研究与应用[D];大连理工大学;2012年
3 李晓辉;基于用户行为分析的数据挖掘系统研究与设计[D];北京邮电大学;2011年
本文编号:2866615
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2866615.html