移动互联网的文件分类审计系统研究与实现
本文关键词: 移动互联网 文件分类 审计系统 网页分类 特征提取 出处:《北京交通大学》2017年硕士论文 论文类型:学位论文
【摘要】:随着移动互联网设备在我国的广泛普及,移动互联网用户正呈现指数级地增长,移动用户上网的流量正占据互联网中的重头。为保障移动互联网安全,及时发现网络中的安全问题,满足国家互联网安全需求,进行移动互联网文件分类审计系统建设是非常有必要的。移动互联网数据海量涌现为审计工作带来了很大困难。当下提出一个适用于移动网络有效的审计方案势在必行,本文在此背景下提出并设计了移动互联网文件分类审计系统。本文以移动互联网的文件分类审计为题,总结国内外已有的工作研究,归纳了文件分类审计工作在移动互联网中遇到的问题,设计了适应移动互联网环境的文件分类审计系统并予以实现。本文的主要内容如下:首先,本文调研文件分类审计工作所涉及技术,总结归纳审计工作的方法与特点,为系统设计做理论基础。同时,本文对文件分类审计工作涉及到的关键技术进行研究,其中包括文本特征提取算法优化、基于特征标识的文件类型识别、基于多进程的性能优化。此后,本文对移动互联网文件分类审计系统进行设计,提出系统目标与整体设计框架,并在此基础上完善设计每一个功能模块。最后,本文对审计系统进行了实现,介绍了系统主要功能,并对上网行为审计功能进行了测试,本文设计和实现的移动互联网审计系统有着良好的业务识别能力以及数据处理功能。本文的主要成果在于:第一,本文提出基于卡方统计特征提取算法的优化算法,并将优化算法应用于系统的网页分类审计。第二,本文提出了限定区域的文件标识匹配方法,并应用于审计系统,实现了对于网络传输文件的审计。第三,本文对系统进行基于多进程的系统性能优化,采用了负载均衡、父子心跳、内存管理等技术优化系统性能,解决了大数据量处理问题。本文旨在研究、分析设计和实现文件分类审计系统,主要对现存审计系统优缺点进行分析,提出相应的改进措施,达到处理大数据量的目的,并将改进技术应用到审计系统,从而提高系统的处理能力。通过测试,结果表明本系统能够满足本文提出的系统目标以及对移动互联网业务的识别审计需求。
[Abstract]:With the wide popularity of mobile Internet devices in China, mobile Internet users are showing exponential growth, mobile users' Internet traffic is occupying a major part of the Internet. Timely discovery of security problems in the network to meet national Internet security needs, It is very necessary to build a classified audit system for mobile Internet files. The emergence of massive mobile Internet data brings great difficulties to the audit work. At present, it is imperative to put forward an effective audit scheme suitable for mobile network. Under this background, this paper puts forward and designs a classification audit system for mobile Internet files. This paper summarizes the problems encountered in the audit of file classification in the mobile Internet, designs and implements a file classification audit system adapted to the mobile Internet environment. The main contents of this paper are as follows: first, This paper investigates the techniques involved in the classified audit of documents, summarizes the methods and characteristics of the audit, and makes a theoretical basis for the design of the system. At the same time, this paper studies the key technologies involved in the audit of classified documents. It includes text feature extraction algorithm optimization, file type recognition based on feature identification, performance optimization based on multi-process. Put forward the system goal and the overall design frame, and on this basis perfect design each function module. Finally, this article has carried on the realization to the audit system, introduced the system main function, and has carried on the test to the Internet behavior audit function. The mobile Internet audit system designed and implemented in this paper has good service identification ability and data processing function. The main achievements of this paper are as follows: first, this paper proposes an optimization algorithm based on chi-square statistical feature extraction algorithm. And the optimization algorithm is applied to the classification audit of the system. Secondly, this paper proposes a matching method of file identification in the limited area, and applies it to the audit system to realize the audit of the network transfer files. Third, This paper optimizes the system performance based on multi-process, adopts load balancing, father and son heartbeat, memory management and other techniques to optimize the system performance, and solves the problem of large amount of data processing. This paper analyzes the design and implementation of the document classification audit system, mainly analyzes the advantages and disadvantages of the existing audit system, puts forward the corresponding improvement measures to achieve the purpose of dealing with the large amount of data, and applies the improved technology to the audit system. The test results show that the system can meet the system objectives and the identification and audit requirements of mobile Internet services.
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN929.5;TP393.01;TP311.52
【参考文献】
相关期刊论文 前10条
1 李彦峰;李丽颖;韩广志;徐尚喻;;VxWorks实时操作系统内存分配算法优化[J];电子世界;2016年05期
2 蒲晓阳;;基于Nginx和Redis高并发web服务负载均衡的研究[J];内江科技;2016年01期
3 赵政;刘吉强;;移动互联网音视频类协议识别技术研究与实现[J];信息网络安全;2014年12期
4 俞杰;王猛;音春;;移动互联网环境下传统网络规划流程与方法优化方案[J];电信工程技术与标准化;2014年04期
5 彭兰;;从网络媒体到网络社会——中国互联网20年的渐进与扩张[J];新闻记者;2014年04期
6 孙正健;陈瑞青;;略谈4G发展背景下网络通信的发展走向[J];无线互联科技;2014年03期
7 赵钢;;基于WinPcap的网络嗅探器设计与实现[J];电脑知识与技术;2013年15期
8 许应康;张阿莉;;基于PCAP格式网络数据包分析软件设计[J];现代电子技术;2013年10期
9 刘建志;田志宏;;基于Netfilter框架和IP Queue机制的轻量级网络防火墙实现[J];智能计算机与应用;2012年04期
10 邱云飞;王威;刘大有;邵良杉;;基于方差的CHI特征选择方法[J];计算机应用研究;2012年04期
相关博士学位论文 前2条
1 林平;网络流量的离线分析[D];北京邮电大学;2010年
2 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
相关硕士学位论文 前10条
1 徐京;基于DPI的电信业务监控系统的分析与设计[D];北京邮电大学;2013年
2 吴小倩;基于Netfilter/Iptables的网络流量监控系统的设计与实现[D];北京邮电大学;2013年
3 曹鼎;文件类型识别技术研究[D];解放军信息工程大学;2011年
4 董茂青;手机网络应用的设计与实现[D];复旦大学;2011年
5 吴晓安;通用集群分组业务核心网设计[D];南京邮电大学;2011年
6 邓先箴;基于关联规则的推荐算法研究与应用[D];华东师范大学;2010年
7 李宁;基于NetFlow技术在企业网络应用中的研究[D];南京理工大学;2009年
8 冯颖;网络舆情敏感话题发现平台的研究[D];北京交通大学;2009年
9 朱丽娜;中文网页分类特征提取方法研究[D];中国石油大学;2009年
10 张铮;基于内容分析的网络监控系统[D];首都师范大学;2009年
,本文编号:1516799
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1516799.html