基于实时日志系统的海量日志服务平台设计与实现
本文选题:日志收集 + 实时流数据 ; 参考:《中国科学院大学(中国科学院工程管理与信息技术学院)》2017年硕士论文
【摘要】:在大数据时代,如果把数据的价值比作黄金,记录用户行为、系统运行状态的日志无疑是提炼宝藏的矿石。除此之外,日志也是开发、测试和运维人员问题调查、系统诊断的主要参考来源。然而随着业务发展,系统规模不断扩大,各种服务也越来越复杂,日志收集这个看似简单的任务也变得越来越具有挑战性。在传统的企业应用系统中,日志数据都是按文件分散存储。这样的日志已经无法满足实时的日志监测和全量的数据挖掘需求。所以,当前需要开发一个日志服务平台来对日志数据进行统一的实时收集、集中存储以及分析。本文完成的主要内容包括:(1)结合企业的实际情况,充分考虑使用便捷性、可靠性以及高效性的基础上确定了系统架构,规划了日志服务平台的框架,设计了系统功能功能模块,存储结构和用户交互界面;(2)基于Kafka消息队列,完成了日志的统一存储,实现了日志实时消费和日志投递模块,对存储方式进行了优化,提高存储资源的利用率;(3)合理设计了日志接入服务,提供了高吞吐量的日志传输管道,支持了海量的实时日志写入;(4)搭建了海量日志服务管理平台,方便用户对日志进行维护和管理。海量日志服务服务平台是针对日志类数据的一站式服务系统,用户无需开发就能快捷的完成数据采集、消费、投递及查询分析等功能,帮助提升公司运维和运营效率,赋能大数据时代的海量日志处理能力。
[Abstract]:In the era of big data, if the data value to gold, record the user behavior, the running state of the system log is undoubtedly treasure ore refining. In addition, the log is to investigate the problem of development, testing and maintenance personnel, the main source of reference for system diagnosis. However, with the development of business, the system continues to expand the scale of services the log collection is more and more complex, this seemingly simple task has become increasingly challenging. In the traditional enterprise application system, log data are stored by file. This log log data has been unable to meet the real-time monitoring and total demand of mining. Therefore, the need to develop a real-time collection the log service platform for unified log data, centralized storage and analysis. The main work of this paper include: (1) according to the actual situation of enterprises, fully consider the use of Convenience, reliability and efficiency based on system architecture determines the planning framework log service platform, the design of the system function module, storage structure and user interface; (2) Kafka message queue based on the complete unified storage log, realizes real-time log consumption and log delivery module for storage the way was optimized to improve the utilization of storage resources; (3) to design a reasonable log access service, provides a log transmission pipeline of high throughput, support real-time log massive write; (4) to build a massive log service management platform, convenient maintenance and management of the massive log. The log service platform is the one-stop service system log data, users can quickly complete without the development of data acquisition, consumption, delivery of query and other functions, help enhance the company's operation and maintenance Efficiency, the ability to deal with massive log processing in the big data age.
【学位授予单位】:中国科学院大学(中国科学院工程管理与信息技术学院)
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 文娟,薛永生,段江娇,王劲波;基于关联规则的日志分析系统的设计与实现[J];厦门大学学报(自然科学版);2005年S1期
2 张晓刚;潘久辉;;MS SQL Server 2000日志分析方法的研究与实现[J];计算机工程与设计;2006年19期
3 李春林;周根鸿;张文体;;重视日志审计确保数据安全[J];医学信息;2007年10期
4 梁晓雪;王锋;;基于聚类的日志分析技术综述与展望[J];云南大学学报(自然科学版);2009年S1期
5 黄海隆;陈赛娉;;计算机日志分析与管理方法的研究[J];大众科技;2006年07期
6 郑毅;;基于日志分析的网络IDS研究[J];襄樊学院学报;2008年11期
7 陈庭平;沈丽娟;曾鹏;;日志服务器建设和应用[J];网络安全技术与应用;2010年09期
8 邹先霞;贾维嘉;潘久辉;;基于数据库日志的变化数据捕获研究[J];小型微型计算机系统;2012年03期
9 罗新;;防火墙日志分析系统的设计与实现[J];计算机时代;2012年02期
10 姜良华;崔建明;;Serv-U FTP服务器日志分析系统设计与实现[J];电脑知识与技术;2010年28期
相关会议论文 前10条
1 马辰;武斌;;一种基于攻击事件图的蜜网日志分析方法[A];虚拟运营与云计算——第十八届全国青年通信学术年会论文集(下册)[C];2013年
2 周涛;;基于数据挖掘的入侵检测日志分析技术研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年
3 陈晨;郑康锋;;一种基于支持向量机的蜜网系统日志分析方法[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
4 刘莉;;基于多协议技术的日志集中管理安全方案[A];2008年中国通信学会无线及移动通信委员会学术年会论文集[C];2008年
5 耿涛;;Web日志分析在电子数据取证中的应用[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
6 闫龙川;王怀宇;李枫;毛一凡;;基于Hadoop的邮件日志分析与研究[A];2012电力行业信息化年会论文集[C];2012年
7 陈庆章;王磊;毛科技;戴国勇;;基于防火墙日志的在线攻击侦查系统的设计与实现(英文)[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
8 王振亚;武斌;;基于MFI-WT算法的蜜网日志分析方法[A];第十七届全国青年通信学术年会论文集[C];2012年
9 金松昌;方滨兴;杨树强;贾焰;;基于Hadoop的网络安全日志分析系统的设计与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
10 朱金清;王建新;陈志泊;;基于APRIORI的层次化聚类算法及其在IDS日志分析中的应用[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
相关重要报纸文章 前10条
1 中航工业南方航空工业集团(有限)公司科技与信息部 邹沪湘;分析日志识别暴力破解[N];计算机世界;2013年
2 ;日志分析中的五个误区[N];网络世界;2004年
3 陈代寿;网管的四两拨千斤[N];中国计算机报;2004年
4 IBM大数据专家 James Kobielus 范范 编译;大数据日志分析借机器学习腾飞[N];网络世界;2014年
5 《网络世界》评测实验室 于洋;用好Web日志[N];网络世界;2004年
6 重庆 航行者;IIS的安全[N];电脑报;2002年
7 河南工业职业技术学院 邱建新;监测Squid日志的五种方法[N];计算机世界;2005年
8 shotgun;入侵检测初步(上)[N];电脑报;2001年
9 朱闵;浅谈企业核心应用的安全审计(下)[N];网络世界;2008年
10 覃进文;在Windows 2000&&2003下快速安装Webalizer[N];中国电脑教育报;2003年
相关博士学位论文 前3条
1 饶翔;基于日志的大规模分布式软件系统可信保障技术研究[D];国防科学技术大学;2011年
2 曹志波;基于日志的任务建模及调度优化的研究[D];华南理工大学;2014年
3 胡蓉;WEB日志和子空间聚类挖掘算法研究[D];华中科技大学;2008年
相关硕士学位论文 前10条
1 张天生;日志采集与分析在Web网站中的设计与实现[D];上海交通大学;2015年
2 周海靖;日志大数据分析平台技术研究[D];山东大学;2015年
3 赖特;网络安全设备日志融合技术研究[D];电子科技大学;2015年
4 董妍妍;基于Hadoop的Teradata数据仓库日志分析系统的设计与实现[D];南京大学;2014年
5 李名弈;IPTVQOS日志分析方法研究[D];复旦大学;2013年
6 刘季函(Liu,Chi Han);基于Spark的网络日志分析系统的设计与实现[D];南京大学;2014年
7 李荣荣;基于Hadoop平台的日志分析系统[D];复旦大学;2013年
8 周云斌;基于主机的日志大数椐分析及安全性检查[D];大连理工大学;2015年
9 张迪;基于NoSQL的大规模Web日志分析系统的设计与实现[D];复旦大学;2013年
10 潘宇轩;基于Django的日志分析系统的设计与实现[D];南京大学;2014年
,本文编号:1742716
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1742716.html