基于网络流量的微信用户行为识别技术
发布时间:2020-06-14 07:57
【摘要】:信息化时代的来临,智能设备及其上的应用程序逐渐成为人们日常生活中不可或缺的一部分。网络流量作为应用程序在网络通讯时传输数据的载体,受到研究者的广泛关注。分析应用程序产生的网络流量可以为网络管理、隐私保护以及用户行为识别等提供重要信息。微信是在中国以及海外华侨用户中极其受欢迎的一款拥有发送文本、图片、语音、视频、红包以及转账等功能的即时通讯类应用程序。然而,微信在给人们的日常生活带来便利的同时,也引发了如微信红包赌局、微信诈骗和微信钓鱼攻击等安全问题。本文针对微信用户行为识别展开深入研究。第一,为了保护用户隐私安全以及提供更好的网络服务,本文提出一种基于流量分类的微信用户行为识别技术。首先分析用户行为产生的网络流量中的特征信息;其次采用固定的时间段切分网络流量至多条表示用户行为的子序列中;然后从子序列中提取流量特征信息,用于构建基于随机森林算法的流量分类模型。在真实数据集上的评估实验结果表明,识别用户行为的平均F1值为88%,其中微信文本与图片均可以实现96%以上的Fl值(F1-Score),而阶段性行为微信红包与转账的F1值为83%。第二,为了分析微信赌博、微信诈骗以及微信钓鱼攻击等安全问题,本文提出基于流量分类的微信用户阶段性行为识别技术。首先分析阶段性行为的特殊性以及各个阶段产生的网络流量中的特征信息;其次以数据包时间间隔切分网络流量至多条表示不同阶段的子序列中;然后根据不同阶段的流量特征信息,从子序列中提取特征信息,用于构建基于随机森林算法流量分类模型。实验结果表明,本文提出的可以准确识别阶段性行为,平均F1值达到96%。综上所述,本文提出的基于网络流量的微信用户行为识别技术具有可行性,可以应用于网络管理、隐私保护和用户行为识别等。因此,本研究具有一定理论和使用价值。 【学位授予单位】:杭州电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP393.06
【图文】:
11APP邋n邋]邋|逦应用程序识别逦k)逡逑图2.1基于端口的应用程序识别技术的一般流程逡逑基于端口的应用程序识别技术的一般流程如图2.1所示,通过收集应用程序逡逑产生的网络流量,解析其数据报文中的TCP报文头部,获取其占用的端口号,逡逑与LANA分配的端口列表匹配,从而识别应用程序的种类。Kim等人发现基逡逑于端口的应用程序识R%技术在识别HTTP、DNS、FTP等类型的流量T是Q囆У模义弦蚱洳捎霉潭ǘ丝诤牛渚瓤梢源锏剑梗埃ヒ陨稀H欢诖蠖嗍τ贸绦虿捎缅义隙素棺⒁约岸丝谖弊暗燃际踔螅诙丝诘氖禦%技术的精度在下降。Moore逡逑等人于2005年提出基于端口的应用程序识别技术的正确率不足70%[||1。另外,逡逑Sdmeider等人在使用基于端口技术识别UDP流量时,,精度仅为24%。因此,基逡逑于端口的技术己不再满足目前应用程序识别技术的需求。逡逑2.1.2基于载荷的应用程序识别技术逡逑在基于端口的应用程序识别技术逐渐不再适用以后
逦?逦80:逦HTTP逡逑11APP邋n邋]邋|逦应用程序识别逦k)逡逑图2.1基于端口的应用程序识别技术的一般流程逡逑基于端口的应用程序识别技术的一般流程如图2.1所示,通过收集应用程序逡逑产生的网络流量,解析其数据报文中的TCP报文头部,获取其占用的端口号,逡逑与LANA分配的端口列表匹配,从而识别应用程序的种类。Kim等人发现基逡逑于端口的应用程序识R%技术在识别HTTP、DNS、FTP等类型的流量T是Q囆У模义弦蚱洳捎霉潭ǘ丝诤牛渚瓤梢源锏剑梗埃ヒ陨稀H欢诖蠖嗍τ贸绦虿捎缅义隙素棺⒁约岸丝谖弊暗燃际踔螅诙丝诘氖禦%技术的精度在下降。Moore逡逑等人于2005年提出基于端口的应用程序识别技术的正确率不足70%[||1。另外,逡逑Sdmeider等人在使用基于端口技术识别UDP流量时
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP393.06
【图文】:
11APP邋n邋]邋|逦应用程序识别逦k)逡逑图2.1基于端口的应用程序识别技术的一般流程逡逑基于端口的应用程序识别技术的一般流程如图2.1所示,通过收集应用程序逡逑产生的网络流量,解析其数据报文中的TCP报文头部,获取其占用的端口号,逡逑与LANA分配的端口列表匹配,从而识别应用程序的种类。Kim等人发现基逡逑于端口的应用程序识R%技术在识别HTTP、DNS、FTP等类型的流量T是Q囆У模义弦蚱洳捎霉潭ǘ丝诤牛渚瓤梢源锏剑梗埃ヒ陨稀H欢诖蠖嗍τ贸绦虿捎缅义隙素棺⒁约岸丝谖弊暗燃际踔螅诙丝诘氖禦%技术的精度在下降。Moore逡逑等人于2005年提出基于端口的应用程序识别技术的正确率不足70%[||1。另外,逡逑Sdmeider等人在使用基于端口技术识别UDP流量时,,精度仅为24%。因此,基逡逑于端口的技术己不再满足目前应用程序识别技术的需求。逡逑2.1.2基于载荷的应用程序识别技术逡逑在基于端口的应用程序识别技术逐渐不再适用以后
逦?逦80:逦HTTP逡逑11APP邋n邋]邋|逦应用程序识别逦k)逡逑图2.1基于端口的应用程序识别技术的一般流程逡逑基于端口的应用程序识别技术的一般流程如图2.1所示,通过收集应用程序逡逑产生的网络流量,解析其数据报文中的TCP报文头部,获取其占用的端口号,逡逑与LANA分配的端口列表匹配,从而识别应用程序的种类。Kim等人发现基逡逑于端口的应用程序识R%技术在识别HTTP、DNS、FTP等类型的流量T是Q囆У模义弦蚱洳捎霉潭ǘ丝诤牛渚瓤梢源锏剑梗埃ヒ陨稀H欢诖蠖嗍τ贸绦虿捎缅义隙素棺⒁约岸丝谖弊暗燃际踔螅诙丝诘氖禦%技术的精度在下降。Moore逡逑等人于2005年提出基于端口的应用程序识别技术的正确率不足70%[||1。另外,逡逑Sdmeider等人在使用基于端口技术识别UDP流量时
【参考文献】
相关期刊论文 前2条
1 刘兴彬;杨建华;谢高岗;胡s
本文编号:2712486
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2712486.html