面向专用网络拥塞诊断的关联规则挖掘算法研究

发布时间:2021-03-01 17:37
  随着网络规模日益庞大,网络的拓扑结构也随着用户的增加而变得越来越复杂。尤其在专用局域网管理过程中,系统管理员需要在掌握网络运行数据和状态基础上分析处理问题,保证专用网络信息服务质量。网络拥塞是众多网络故障中最为常见的一种。专用网络在解决网络拥塞诊断过程中,传统解决手段主要依靠费时的人工方式进行。这些促使网络拥塞诊断引入新的技术。本文针对专用网络拥塞诊断问题开展研究,通过收集网络数据信息进行关联规则的挖掘,发现数据之间隐藏的关联关系,为网络拥塞诊断提供支持。对大规模专用网络数据采集方法研究并进行数据处理。针对专用网络自身结构复杂、整体网络规模较大、各种网络节点密度高、数据传输变化快和网络流量行为复杂等特点,设计了网络数据混合式采集方法。通过数据采集节点并行部署、混合式采集的方法进行网络数据的采集。对收集到的网络拥塞数据进行数据处理,针对原始数据中出现的数据重复、非结构化、噪声等问题进行处理,通过对数据进行清洗、集成、筛选、转换使数据达到关联规则挖掘的使用要求。建立基于Apriori和基于FP-Growth的网络拥塞数据关联规则挖掘算法模型,提出改进型算法并建立算法模型。对网络拥塞问题进行... 

【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校

【文章页数】:88 页

【学位级别】:硕士

【部分图文】:

面向专用网络拥塞诊断的关联规则挖掘算法研究


部分数据信息解析数据

统计图,统计图,数据,数据项


第五章网络拥塞关联规则挖掘实验及结果分析59属性,这些数据属性存在着重要性的划分。面对如此巨大的数据量,这时就需要我们将网络拥塞数据集中对于拥塞诊断挖掘无关的数据项进行筛选删除,保留有意义的数据项,并对数据项中重要性很低的数据项一并进行过滤筛眩4.数据转换。这个步骤主要是对数据属性和值型进行相应的转换。经过对数据库表结构的分析关联查出解析出数据表1记录32330条,数据表2记录58531条,数据表3记录155921条,数据属性39个。经过数据清洗集成融合过滤掉不符合要求的记录后,得到数据总计246782条,39个数据属性。通过对处理后的数据进行分析,可以看到使用的数据中各种协议所占比例的情况。从图5-4中可以看出,出现频次最高的TCP协议频次达到14万以上,UDP协议频次近8万次,TLSv1.2近2万次出现,其他种类协议出现次数相对较少。拥塞数据主要协议出现频次的示意图如图5-5所示。图5-5协议统计中前四位的协议出现频次统计图数据中除去占比最高的四种协议之外,其他协议占比较低,出现频次较少。从数据统计结果百分比图5-5中,我们可以看出占数据总量百分比最高的前四位协议的情况分别是TCP协议总数量中协议60.2%,UDP协议占比31.8%,TLSv1.2占比6.5%,HTTP占比达1.4%,分布占比图如图5-6所示。

统计图,情况,数据集中,硕士学位


电子科技大学硕士学位论文60图5-6协议统计中前四位的协议占比情况图数据集中出现较少的其他协议,这些协议出现的频次如图5-7所示,在总的数据库中占比情况如图5-8所示。图5-7协议统计中其他协议出现频次统计图


本文编号:3057805

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3057805.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1d3d2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com