一种基于OpenTSDB的海量实时数据存储系统
本文选题:分布式系统 切入点:OpenTSDB 出处:《华南理工大学》2016年硕士论文 论文类型:学位论文
【摘要】:海量数据的存储与查询是进行大数据分析的先决条件,如何高效灵活的存取海量数据已成为当前业内的研究热点。华南理工大学能耗数据分析平台采用传统的关系型数据库作为其存储支撑,但受限于其理论模型与体系结构,很难在性能和扩展性方面满足大数据情景下的数据需求。非关系型数据库可以较好的解决这些问题,但其功能往往较为简单,在复杂查询和事务管理等方面支持有限,并且缺乏标准化的查询语言或接口,难以与基于SQL的查询逻辑兼容,技术迁移难度大。为了解决上述问题,本文对能耗分析平台内实时数据的特征进行了详细分析,并在广泛技术调研的基础上,整合关系型数据库与非关系型数据库的各自优势,设计并实现了一套基于OpenTSDB的海量实时数据存储系统。该系统的核心设计思想是:构建由关系数据库和非关系数据库OpenTSDB组成的异构数据库集群,关系数据库中存储关系特征强的、存在事务或复杂查询需求的数据;OpenTSDB则用于支撑海量实时数据的存储。在数据持久层模块上,本文创新性的提出了一种基于面向切面编程的设计方案,借助Spring AOP增强Mybatis这一关系型数据库数据持久化框架的查询方法,在一次接口调用过程中同时实现两类数据库的查询,用关系数据库查询结果驱动OpenTSDB的查询,并最终按照接口定义返回规范的查询结果。这一设计方案无需对相关框架或数据库的代码进行修改,实现了各个模块之间的松耦合,并且不会对上层的业务逻辑产生影响,具有良好的兼容性,极大的降低了技术迁移的难度。本文还提出了一种基于冗余存储的顺序读取优化设计方案,以额外的存储空间为代价换取了使用不同字段进行顺序读取效率提升。华南理工大学能耗数据分析平台上进行的一系列测试显示基于OpenTSDB的海量实时数据存储系统具备完善的功能并有着良好的随机/顺序访问性能。
[Abstract]:Storing and querying massive data is a prerequisite for big data's analysis. How to access mass data efficiently and flexibly has become a research hotspot in the industry. The energy consumption data analysis platform of South China University of Technology uses the traditional relational database as its storage support, but is limited by its theoretical model and architecture. It is difficult to meet the data requirements in big data's situation in terms of performance and extensibility. Non-relational databases can solve these problems better, but their functions are often relatively simple, and their support for complex queries and transaction management is limited. And lack of standardized query language or interface, it is difficult to be compatible with query logic based on SQL, technology migration is difficult. In order to solve the above problems, the characteristics of real-time data in the energy consumption analysis platform are analyzed in detail. And on the basis of extensive technical investigation, integrating the respective advantages of relational database and non-relational database, A massive real-time data storage system based on OpenTSDB is designed and implemented. The core of the system is to construct a heterogeneous database cluster composed of relational database and non-relational database OpenTSDB. OpenTSDB, which has transaction or complex query requirements, is used to support the storage of massive real-time data. In the module of data persistence layer, this paper proposes an innovative design scheme based on section-oriented programming. With the help of Spring AOP to enhance the query method of Mybatis, which is the framework of relational database data persistence, the query of two kinds of databases is realized simultaneously in the process of single interface call, and the query of OpenTSDB is driven by the query result of relational database. Finally, the standard query result is returned according to the interface definition. This design scheme does not need to modify the code of the related framework or database, realizes the loose coupling between the various modules, and does not have an impact on the business logic of the upper layer. It has good compatibility and greatly reduces the difficulty of technology migration. This paper also proposes an optimized design scheme of sequential reading based on redundant storage. A series of tests conducted on the platform of energy consumption data analysis of South China University of Science and Technology show that the massive real-time data storage system based on OpenTSDB is based on the results of a series of tests conducted on the platform of energy consumption data analysis of South China University of Technology. Has the perfect function and has the good random / sequential access performance.
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP333
【相似文献】
相关期刊论文 前10条
1 ;永久性数据存储系统寻求合作[J];电脑与电信;2009年02期
2 杨则正;美国空军人员数据存储系统[J];管理科学文摘;1994年07期
3 李亮元;周银珍;;数据存储系统在银行的应用[J];金融电子化;2002年11期
4 陈端荣,裴先登,谢长生,让光林;体全息数据存储系统中的一种调制码研究[J];小型微型计算机系统;2003年01期
5 张展 ,何岷 ,徐广毅;嵌入式电子飞行仪表系统(一)——数据通信和数据存储系统设计[J];电子世界;2003年05期
6 杨光镇;中山电力数据存储系统方案[J];电力信息化;2004年05期
7 邢笠;;数字图书馆数据存储系统解决方案的探讨[J];浙江万里学院学报;2006年02期
8 沈兆龙;江兵;蔡建文;唐火红;邢卉;徐敏;黄文浩;;共焦双光头多层数据存储系统[J];光电工程;2007年07期
9 张李荪;;信息化建设中的数据存储系统建设[J];人民长江;2009年07期
10 李二补;;数据存储系统中可靠性及容错性研究[J];山西科技;2010年01期
相关会议论文 前3条
1 江杨;;流数据存储系统体系结构研究[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
2 章政海;;电厂数据存储系统总体构架研究[A];二○○九年全国电力企业信息化大会论文集[C];2009年
3 李非;邱天爽;迟戈;魏晶;;高速数据存储在CT成像系统中的应用研究[A];2008年医疗仪器学术年会暨理事会论文汇编[C];2008年
相关重要报纸文章 前10条
1 惠闻;SAN应用不再难[N];网络世界;2000年
2 ;SAN——高瞻者的选择[N];网络世界;2001年
3 ;传统存储方式 面临变革[N];中国计算机报;2004年
4 ;突破存储的极限[N];中国电脑教育报;2004年
5 ;惠普简化行业数据存储系统[N];人民邮电;2005年
6 ;青岛大学医学院附属医 Centera 应用案例[N];中国电子报;2005年
7 陈旭兵;岳阳医院“分级存储”PACS构建[N];网络世界;2008年
8 程鸿;政府信息资源需层次化管理[N];计算机世界;2004年
9 刘燕;福建采购工商管理系统信息建设项目[N];政府采购信息报;2008年
10 IBM存储事业部 张英伟;用逻辑卷镜像安全备份[N];中国计算机报;2006年
相关博士学位论文 前1条
1 陈海霞;计算机数据存储系统中读写头/盘间超薄气膜动力稳定性研究[D];华中科技大学;2004年
相关硕士学位论文 前10条
1 韩亮;手机售后维修管理及其数据存储系统的设计与实现[D];吉林大学;2016年
2 单若琦;一种基于OpenTSDB的海量实时数据存储系统[D];华南理工大学;2016年
3 钟晓华;银行操作数据存储系统的分析与应用[D];内蒙古大学;2009年
4 黄丽华;江西电信公司运营数据存储系统的升级方案设计[D];南昌大学;2010年
5 李启芳;成工职校校园网络数据存储系统的设计与应用[D];电子科技大学;2014年
6 张灿;云存储中的数据动态平衡技术研究[D];上海交通大学;2012年
7 王建光;大规模时间序列数据存储系统的研究与实现[D];华中科技大学;2013年
8 黄寅;高速数据存储系统的设计与应用[D];华中科技大学;2009年
9 苏文洲;容忍入侵的数据存储系统研究与设计[D];兰州大学;2006年
10 祁军;运营数据存储系统的设计与实现[D];南京邮电大学;2012年
,本文编号:1581360
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1581360.html