教育部数据中心数据管理优化策略研究
本文选题:教育数据管理 切入点:成本优化 出处:《北京科技大学》2017年博士论文 论文类型:学位论文
【摘要】:针对教育数据的快速增长和巨大分析需求,考虑信息安全和基础网络、软硬件资源等因素制约,本文研究教育数据存储的优化管理、任务调度、容错部署等问题,以降低教育数据在管理上的总体成本,提升系统效率和可靠性。论文的主要研究成果有:(1)针对教育数据中心的传统竖井式建设模式成本高、无差别数据存储造成存储空间利用率不高的问题,选取在成本和横向扩展能力上更合适的分布式并行处理方式,提出了基于相关性的列组合聚类及列组合配置策略。在界定搜索查询热度值的基础上构建带有查询热度值的数据列组合,考虑集群中节点负载情况,提出了最小存储成本策略,在降低存储空间成本的同时有效提高教育数据查询分析效率。(2)针对教育数据查询分析面对的巨大压力和响应要求,对教育数据分析任务进行量化和优先级划分,综合考虑服务成本,量化节点分析承载能力,提出了“基于综合效用的教育数据调度模型”。基于系统的整体负载率,提出了优化的任务调度优化策略。(3)针对教育数据的列组合特性,提出数据重要性的界定方法,基于节点负载和数据重要性提出了数据选择性恢复策略,提高了系统的可用性。(4)针对教育分析系统分布式数据节点故障问题,提出了节点故障下资源优化部署模型和部署策略,保证数据的完整性和可用性,并给出了教育数据中心的运维保障策略,以提高系统的服务可靠性。
[Abstract]:In view of the rapid growth of educational data and the huge demand for analysis, considering the constraints of information security and basic network, hardware and software resources, this paper studies the optimization management of educational data storage, task scheduling, fault-tolerant deployment, and so on. In order to reduce the overall cost of educational data management, improve the efficiency and reliability of the system. Due to the low utilization of storage space caused by the nondifferential data storage, a more suitable distributed parallel processing method in cost and horizontal expansion ability is chosen. In this paper, a column combination clustering and column combination configuration strategy based on correlation is proposed. Based on defining the search query heat value, a data column combination with query heat value is constructed. Considering the node load in the cluster, a minimum storage cost strategy is proposed. In order to reduce the cost of storage space and improve the efficiency of educational data query and analysis, the paper quantifies and prioritizes the task of educational data analysis, aiming at the enormous pressure and response demand of educational data query and analysis. Considering the cost of service and quantifying the load carrying capacity of nodes, this paper puts forward a "educational data scheduling model based on comprehensive utility", which is based on the overall load rate of the system. This paper proposes an optimized task scheduling optimization strategy. (3) according to the column combination characteristics of educational data, a method to define the importance of data is proposed, and a data selective recovery strategy based on node load and data importance is proposed. Aiming at the problem of distributed data node failure in educational analysis system, this paper proposes a resource optimal deployment model and deployment strategy under node failure to ensure the integrity and availability of data. In order to improve the reliability of the system, the operation and maintenance strategy of the educational data center is given.
【学位授予单位】:北京科技大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:G40-058
【相似文献】
相关期刊论文 前5条
1 来羽;;精细分析Oracle分布式系统数据复制技术[J];中州大学学报;2010年05期
2 高振清;;分布式数据库数据复制技术研究[J];延安职业技术学院学报;2013年05期
3 颜凯;左志宏;;两地三中心是最理想模式——电子科技大学灾备方案探索[J];中国教育网络;2008年08期
4 许俊;张勇;;基于数据库复制的校园数据整合应用——以四川职业技术学院为例[J];四川职业技术学院学报;2012年01期
5 ;[J];;年期
相关会议论文 前3条
1 王文阁;;Oracle GoldenGate Veridata数据验证技术的研究与应用[A];2013电力行业信息化年会论文集[C];2013年
2 王文阁;;Oracle GoldenGate Veridata数据验证技术的研究与应用[A];2013电力行业信息化年会论文集[C];2013年
3 娄燕飞;杨树强;李爱平;贾焰;;一种基于组通信的复制数据库在线恢复策略研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
相关重要报纸文章 前7条
1 本报记者 张峰;数据集中 服务三农[N];网络世界;2005年
2 清华大学信息技术研究院 刘川意 鞠大鹏 汪东升 清华大学-威视数据安全研究所 刘宏 侯海波;复制和恢复:让数据丢失更少些[N];计算机世界;2006年
3 含笑;数据集中、安全一手抓[N];中国计算机报;2002年
4 本报记者 邢小萍编译;数据复制技术的奥秘[N];网络世界;2009年
5 陈骏;保证业务连续性的三种方式[N];中国计算机报;2006年
6 ;朗登[N];中国计算机报;2001年
7 ;远程数据复制技术[N];中国计算机报;2001年
相关博士学位论文 前2条
1 郭伟;云计算环境中数据放置及复制策略研究[D];山东大学;2015年
2 吴齐跃;教育部数据中心数据管理优化策略研究[D];北京科技大学;2017年
相关硕士学位论文 前10条
1 程冠皓;基于数据的信用评级处理和分析系统的设计与实现[D];哈尔滨工业大学;2015年
2 张成凤;水泥生产过程数据SQL Server存储方法研究[D];济南大学;2016年
3 刘杜鹃;移动云环境中数据计算卸载和分布式云存储管理问题的研究[D];深圳大学;2016年
4 李娟;分布式数据库数据复制技术研究[D];中国石油大学;2007年
5 柳小青;税收征管系统中数据复制技术研究与实现[D];重庆大学;2007年
6 曾芳;达梦数据库系统动态数据复制技术研究[D];华中科技大学;2007年
7 张湘辉;分布式数据库数据复制技术研究与应用[D];武汉大学;2004年
8 林伟;远程卷复制系统的研究和开发[D];西北工业大学;2005年
9 南菊松;分布式数据库系统中数据分配算法研究[D];华中科技大学;2013年
10 杨东;贵州移动业务支撑系统数据信息安全的研究与实现[D];贵州大学;2006年
,本文编号:1628369
本文链接:https://www.wllwen.com/shoufeilunwen/sklbs/1628369.html