当前位置:主页 > 管理论文 > 移动网络论文 >

基于机器学习的GTalk流量识别系统的设计与实现

发布时间:2021-01-21 22:52
  近年来,随着网络技术的迅猛发展,即时通讯类工具数量剧增,给有效控管网络流量造成了极大的困难。在巨大的网络流量中,不可避免的存在着许多的异常流量,其中不乏存在一些用户借助某些软件进行违法作业的恶意行为。Google Talk作为即时通讯类工具的典型代表,它可以作为网络代理实现网络穿透,这给网络管理和网络安全带来了极大的麻烦。因此,对Google Talk流量进行有效的识别是十分迫在眉睫的。目前大多数的Google Talk流量识别系统都只能识别出Google Talk流量,无法做到将Google Talk流量细分。本论文主要是围绕在网络流量中如何实时高效的识别并细分出Google Talk的四类流量这个问题,通过在系统中实现四种流量识别技术,以基于机器学习的流量识别技术为核心,其余三种流量识别技术作为辅助,最终达到Google Talk流量细分的目的。本文在研究了Google Talk流量识别系统的现实意义基础上,分析了与本课题相关的国内外的研究现状,在项目的需求分析以及概要设计阶段,建立了用户的用例模型,确定了功能需求和非功能需求,并确定了技术方案,设计一个基于机器学习的Google ... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:88 页

【学位级别】:硕士

【部分图文】:

基于机器学习的GTalk流量识别系统的设计与实现


IM框架体系中的协议间的关系

客户端,服务器,工程硕士学位,工作流程


哈尔滨工业大学工程硕士学位论文.2.3XMPP 工作流程了解了 XMPP 的架构,最重要的就是清楚 XMPP 的工作流程,这对流量是最重要的。客户端先向服务器发送一个请求,要求建立到服务器的连接连接建立好后,则客户端可以通过连接的服务器与连接用户进行互连通信 3-4 展示了客户端用户 Alice 与 Bob 之间建立通信的全过程。客户端在建讯后,利用服务器来中转信息。

连接服务器,识别特征,报文,端口


当通信结束时,会以</stream>为结尾,通信结束。3.3 Google Talk 静态特征分析3.3.1 协议识别Google Talk 协议识别采用端口及 IP 的方式进行,具体端口及 IP 地址如下:端口特征:5222 端口或 443 端口。服务器 IP 地址:74.126.XX.125,(XX 有可能是 71、73、41、43、93 等其他值中的一个,因为 talk.google.com 这一域名下对应了多个 IP,而具体为哪一个,取决于所处的网络环境)。内容特征:由于 XMPP 以 XML 协议为通信内容协议,因此客户端与服务器在会话开始的时候都要初始化 XML 根结点,XMPP 协议中采用<stream>为XML 根结点,代表流的意思。通过分析 XMPP 协议的规定以及抓包验证分析可知,客户端和服务器端在建立连接后,都会发送以“<stream:stream”<stream>开头的初始化信息。因此可以用“<stream:stream”为特征串。具体如图 3-9 所示。


本文编号:2992031

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2992031.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d47dc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com