基于行为特征的私有P2P流量的识别和分析
发布时间:2017-05-20 11:17
本文关键词:基于行为特征的私有P2P流量的识别和分析,,由笔耕文化传播整理发布。
【摘要】:基于P2P技术的应用在我国经过十余年的发展,己逐步成为互联网技术改变广大用户生活方式进程中不容忽视的组成部分。但对于网络服务提供商而言,随着P2P应用的广泛使用,带宽资源的巨大消耗一直是影响网络整体服务质量的重要因素。尽管网络服务提供商已经针对P2P流量的识别和管理做了很多研究,提出了一些解决方案,这个问题仍有进一步改善的空间。特别是随着大数据时代的到来,使得在大规模的数据集上实现计算成为可能,与这些新型技术的结合为很多领域的理论研究带来了新的突破。面对海量的P2P网络流量,可以利用云计算技术突破计算的瓶颈,从更加完整和宏观的角度上观察P2P流量的分布情况,总结其特征,进而提出在海量数据中识别P2P流量的方案。本文中,首先介绍了当前得到广泛应用的分布式计算平台Hadoop的基本结构和相关组件的特点。之后,以具体的P2P应用软件为例介绍了P2P业务的通信流程,并在此基础上从P2P中不同角色的行为特征的角度,总结提出了适用于MapReduce编程模型的P2P流量的识别方法,这种方法可以有效处理海量网络流量数据,适应当前快速增长的数据规模和处理需求。接着,介绍了基于Hadoop平台实现的分布式P2P流量识别和分析系统的详细设计方案,重点介绍了话单关联、并发汇聚和角色识别等核心组件。最后,结合识别结果对P2P流量的一些特征进行了总结和分析。
【关键词】:P2P流量 海量数据 分布式计算平台 行为特征
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.06
【目录】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 绪论9-13
- 1.1 课题背景9-10
- 1.2 研究意义10-11
- 1.3 论文结构11-13
- 第二章 分布式平台Hadoop简介13-19
- 2.1 Hadoop体系13-15
- 2.2 Hadoop分布式文件系统(HDFS)15-16
- 2.3 HBase16-17
- 2.4 MapReduce编程框架17-19
- 第三章 私有P2P业务流量的识别方法19-49
- 3.1 私有P2P业务的通信流程19-42
- 3.1.1 启动客户端19-23
- 3.1.2 进行资源搜索,并进入资源所在网页23-26
- 3.1.3 点击视频资源链接与播放器插件的下载26-34
- 3.1.4 与若干功能服务器的交互34-38
- 3.1.5 与资源调度服务器的交互及资源的下载38-41
- 3.1.6 与其他Peer的交互41-42
- 3.2 私有P2P业务流量的识别方法42-49
- 3.2.1 实验数据42-44
- 3.2.2 识别方法44-49
- 第四章 基于分布式平台的P2P流量识别和分析系统49-59
- 4.1 系统概述49
- 4.2 配置信息读取模块49-50
- 4.3 预处理模块50-52
- 4.3.1 数据清洗50-51
- 4.3.2 话单关联51-52
- 4.4 流量识别模块52-56
- 4.4.1 特征字匹配52-53
- 4.4.2 并发汇聚53-54
- 4.4.3 角色识别54-56
- 4.5 HBase存储模块56-58
- 4.6 深度分析模块58-59
- 第五章 P2P流量特征分析59-61
- 5.1 并发连接分布情况59
- 5.2 并发连接成功率59-60
- 5.3 有效连接的报文长度60-61
- 第六章 总结和展望61-63
- 参考文献63-65
- 致谢65-67
- 攻读学位期间发表的学术论文目录67
【参考文献】
中国期刊全文数据库 前1条
1 何杰;杨岳湘;乔勇;唐川;;基于簇流的P2P流量精确分类技术(英文)[J];中国通信;2013年11期
本文关键词:基于行为特征的私有P2P流量的识别和分析,由笔耕文化传播整理发布。
本文编号:381476
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/381476.html