赛博—物理空间中数据分布式聚合与大规模处理关键技术研究

发布时间:2018-01-10 09:34

  本文关键词:赛博—物理空间中数据分布式聚合与大规模处理关键技术研究 出处:《国防科学技术大学》2016年博士论文 论文类型:学位论文


  更多相关文章: 赛博-物理空间 大数据处理 矩阵处理 任务调度 实体关系 分布式处理


【摘要】:赛博-物理空间作为信息空间和物理空间的融合,可以使得具有信息感知、信息交换以及计算能力的实体根据应用需求互相关联。这种实体间的关联关系涵盖了从物理域、信息域到社会域多维度的信息,具有大规模、分布、动态等多种特性。在这样一种融合空间中开展、开发应用越来越成为科学工作者关注的话题。在赛博-物理空间中,从信息感知的角度来讲,需要面对大规模实体信息及实体间关系的分布式发现及聚合的挑战。这里实体间关系包括了根据应用需求从不同维度进行描述的信息,例如实体在物理空间中的相对位置关系、由和用户相关的社会属性所表达的逻辑关系等。而从信息聚合的角度来讲,需要面对实体及实体间关系动态性所带来的挑战。这里动态性包括实体状态变化、实体位置变化等引起的实体属性值的动态性,以及由此引起的实体间关联关系的动态性等。而从信息处理的角度来讲,需要面对大规模异构数据高效处理带来的挑战,包括特定类型大规模数据处理的设计,以及多样化业务模式对大规模数据处理平台需求方面的设计等。本文从赛博-物理空间应用中如何进行有效的信息聚合和高效的大规模数据处理两个角度展开,研究如何高效地以分布式方式对实体间关系的发现,面向赛博-物理空间中实体及实体间的动态性,研究如何满足应用对实体稳定关系发现的需求,即如何有效构建稳定子网络,针对数据处理需求如何进行特定类型数据处理模型的设计,以及面向多样化业务模式如何进行数据处理平台融合和任务调度优化。本文工作主要分为以下四个方面:1.基于分布式聚合模型的低负载实体关系发现机制:通过建立赛博-物理空间中分布式的关系发现模型,考虑到多重关系同时发现的需求,设计了基于生成树的分布式关系发现算法MSTRD,使得赛博-物理空间中实体间关系从传统的集中式发现转变为分布式发现,同时保证关系发现过程的高效性,即降低关系发现过程的数据传输量和时间耗费。实验结果表明MSTRD方法不管是从关系发现过程中数据传输总量还是时间耗费上来讲都比集中式的处理方式性能更优,最大数据传输量可节省1/3左右,同时在极端情况下可节省近一半的时间耗费。2.面向分布式动态聚合网络的稳定子网构建机制:通过建立面向赛博-物理空间中应用的分布式实体模型,设计了分布式的实体集合选择算法MRMC,通过该分布式实体集合选择算法,可以在实体集合规模增长有限的情况下提高实体间关系保持不变的时间RUT,即稳定子网络。大量的模拟实验对MRMC算法进行了正确性和有效性验证,结果表明,MRMC算法可以对实体间关系保持不变时间RUT的提升最大达一倍左右。3.基于矩阵抽象的赛博-物理空间大规模数据处理框架:本文设计了面向矩阵运算的通用计算框架Matrix Map,构造了横跨内存和外存的可扩展的数据结构块式键值矩阵BKM,设计了针对算法并行性的数据重组和异步计算的优化策略,以及针对通用矩阵运算的一元、二元操作符。实验结果表明,针对一些常见的图处理算法,Matrix Map比Spark等流行系统在处理速度上最多可以快10倍左右。4.面向赛博-物理空间应用多样化业务模式的大数据平台融合技术:针对大数据处理平台的多样性和繁杂性,通过分析当前主流大数据处理平台的优劣,提出了对不同大数据处理平台进行融合的方案,设计了针对不同数据处理任务在融合系统内的调度框架,设计了基于遗传算法的任务分簇和调度优化策略MMRC,进而提高数据处理效率、降低资源耗费。模拟实验结果表明,和单一系统处理相比,MMRC方法可以对任务的处理时间减少10%左右,资源耗费仅占所有节点资源30%左右。通过上述四个方面的研究,我们可以在很大程度上对赛博-物理空间中应用提供基础性支持,可以为赛博-物理空间中应用的拓展提供有效地支撑。
[Abstract]:Cyber - physical space fusion as information space and physical space, can be made with information awareness, information exchange and computing entities according to the application requirements related to each other. The relationship between entities ranging from physical domain, information domain to the social domain and multi dimension information, has the scale, distribution, dynamic and other characteristics. In such a space to carry out the integration, development and application are becoming more and more scientific workers pay close attention to the topic. In cyber - physical space, from the perspective of information perception, need to face the large-scale distributed entity information and the entity relation discovery and aggregation challenge. Here the relationship between entities including the description of information from different the dimension according to the application requirements, such as the entities in the physical space of the relative position, expressed by the social attribute and user related logical relations. From the letter Information aggregation perspective, need to face the entities and the relationship between dynamic challenge. Here include dynamic entity state changes, dynamic changes caused by the physical location of entity attribute values, and the resulting entity relationship between dynamic. From the information processing perspective, the need for efficient the challenges facing the large-scale processing of heterogeneous data, including the design of specific types of large-scale data processing, and the diversified business model for large scale data processing platform needs the design. This article from the cyber physical space in the application of how to carry out effective information aggregation and efficient large-scale data processing of two angles, to study how to efficiently distributed on relations between entities, cyber - oriented dynamic entities in the physical space between the research on how to satisfy the application of real Find the relationship between body stable demand, that is how to build a stable network effectively, according to data processing needs how to design a specific type of data processing model, as well as for the diversified business model to the platform integration and task scheduling optimization of data processing. This paper is mainly divided into the following four aspects: 1. low load entity relationship model of distributed polymerization based on the discovery mechanism: through the establishment of distributed cyber - physical space discovery model, considering the multiple relations also found the demand, design the MSTRD algorithm found distributed relation based on spanning tree, the relationship between entities in cyber - physical space from the traditional centralized discovery into distributed, while ensuring the efficiency of the process of relation discovery that is, to reduce the amount of data transmission between the discovery process and time consuming. The experimental results show that the MSTRD method is not tube From the relationship found in the process of data transmission or total time speaking than the centralized processing performance better, the maximum amount of data transmission can save about 1/3, while steady stator net construction mechanism saves half of the time spent in.2. oriented distributed dynamic aggregation network in extreme cases: through the establishment of cyber - oriented distributed entities the model used in the physical space, the design of a distributed entity set selection algorithm MRMC selection algorithm through the distributed object set, can be set in the scale of growth is limited to improve the relationship between entity entity constant time RUT, stable sub networks. Extensive simulation experiments are carried out to verify the correctness and validity. The results show that the MRMC algorithm, MRMC algorithm can keep lifting up one time RUT times.3. matrix Abstract Based on race relations between entities Bo - physical space of large scale data processing framework: This paper designs a general computational framework for Matrix Map matrix, to construct scalable data structure block key matrix BKM across the memory and storage, the design optimization strategies for the parallel algorithm of data reorganization and asynchronous computation, as well as a general matrix element two yuan, operator. Experimental results show that for some common image processing algorithms, the Matrix Map Spark system can be the most popular than about 10 times faster than.4. for cyber - physical space application of diversified business model platform big data fusion technology in processing speed for large data processing diversity and complexity of the platform. Through the analysis of the current mainstream big data processing platform advantages and disadvantages, proposed fusion scheme for different data processing platform, designed for different tasks in data processing Integrated scheduling framework in the system design and optimization strategy of MMRC cluster scheduling genetic algorithm based on the task, and then improve the efficiency of data processing, reduce the consumption of resources. The simulation results show that the single system and compared, MMRC method can deal with time on task decreases about 10%, resource consumption accounted for only 30% of all nodes right. Through the above four aspects, we can largely to provide basic support application of cyber - physical space, can provide effective support for the development and application of cyber - physical space.

【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 胡瑶 ,段鹏瑞 ,高文昌;网络优化的数据处理平台[J];中国无线电;2004年11期

2 黄卫军;口岸城市通关数据处理平台[J];上海信息化;2005年01期

3 林华兵;;数据处理平台高可靠性的设计与实现[J];中国金融电脑;2010年11期

4 胡继军;;浅谈统计部门在数据处理平台设计中应考虑的问题[J];现代经济信息;2012年14期

5 王业斌;;省级防雷业务数据处理平台的开发[J];科技信息;2009年30期

6 龚一飞;刘万才;;农作物有害生物调查项目数据处理平台的构建与实现[J];中国植保导刊;2012年03期

7 邢煜;;一种海量数据处理平台的解决方案[J];电脑知识与技术;2013年21期

8 蔡玉宝;左春;张正;邹志强;;数据处理平台的研究与实现[J];计算机工程与设计;2008年07期

9 张涛;李建;康永佳;;多任务高并发数据处理平台的技术研究[J];网络安全技术与应用;2010年03期

10 宋均;祝林;;基于云计算的海量数据处理平台设计与实现[J];电讯技术;2012年04期

相关会议论文 前6条

1 王业斌;徐建鹏;王凯;;安徽省常规防雷业务服务数据处理平台的开发[A];信息技术在气象领域的开发应用论文集(一)[C];2005年

2 季晓林;刘海砚;;基于数据处理平台的空间矢量数据融合[A];中国地理信息系统协会第八届年会论文集[C];2004年

3 赵旭霞;刘立峰;邵起明;;智能路测系统中的数据处理平台[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年

4 张鹏;;基于XML/Java的数据处理平台[A];Java技术及应用的进展——第八届中国Java技术及应用交流大会文集[C];2005年

5 丁辉;张大华;罗志明;;基于Hadoop的海量数据处理平台研究[A];2011电力通信管理暨智能电网通信技术论坛论文集[C];2011年

6 陶金花;苏林;李树楷;;一种基于网格的LiDAR数据处理平台架构[A];2007年先进激光技术发展与应用研讨会论文集[C];2007年

相关重要报纸文章 前5条

1 本报记者 刘书臻;山东:数据处理平台建成[N];中国信息报;2011年

2 杨小国;“四大工程”助推普查资料开发提速[N];中国信息报;2012年

3 董平;创新,永不止步[N];中国国门时报;2011年

4 《网络世界》记者 李夏艳;直面无线挑战[N];网络世界;2012年

5 ;“康师傅”喜新厌旧[N];网络世界;2002年

相关博士学位论文 前2条

1 陆宏亮;赛博—物理空间中数据分布式聚合与大规模处理关键技术研究[D];国防科学技术大学;2016年

2 林文辉;基于Hadoop的海量网络数据处理平台的关键技术研究[D];北京邮电大学;2014年

相关硕士学位论文 前10条

1 张利平;基于MPC8536的雷达嵌入式数据处理平台设计[D];电子科技大学;2015年

2 潘思聪;基于云环境的电信数据处理平台设计与实现[D];上海交通大学;2014年

3 严华;统计局数据处理平台的设计和实现[D];电子科技大学;2014年

4 张波;基于大数据技术的公安移动通信数据处理平台设计与实现[D];山东大学;2016年

5 周碧漳;面向量化交易的金融数据处理平台研究与原型实现[D];电子科技大学;2016年

6 张杰;面向车载信息的大规模数据处理平台技术研究[D];电子科技大学;2016年

7 王华慈;MapReduce型海量数据处理平台中数据放置技术研究[D];北京工业大学;2016年

8 樊明璐;流式大数据处理平台中资源动态调度技术研究[D];北京工业大学;2016年

9 杨鹏;面向流式数据处理平台JStorm的负载均衡技术研究[D];北京工业大学;2016年

10 冯朝阁;基于YARN的工业大数据处理平台研究与实现[D];西安电子科技大学;2015年



本文编号:1404764

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1404764.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eab7b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com