当前位置:主页 > 科技论文 > 软件论文 >

一种正交分解大数据处理系统设计方法及实现

发布时间:2018-10-30 16:58
【摘要】:MapReduce等计算框架的出现开启了大数据处理新纪元,以Hadoop,Spark为代表的大数据处理系统具有大吞吐率、跨平台、高可扩展的优势,并得到广泛应用.然而,为避免与具体的操作系统、硬件平台绑定,这些系统的设计与优化集中在计算模型、调度算法等方面,无法充分利用底层平台的优势.提出了一种基于正交分解的大数据处理系统设计与优化方法,将系统分解为松耦合的多个功能正交的模块,使存储、处理功能分离出来,交给能够利用底层平台操作系统甚至硬件资源的存储、执行引擎,原大数据系统退化为调度平台;进而,提出基于锁无关机制的存储底层优化策略和基于指令超级优化的执行引擎底层优化策略.以此为指导,以Hadoop作为兼容和改进的对象,实现了原型大数据处理系统Arion.Arion既能保持Hadoop的跨平台、高可扩展的优势,又能消除任务执行的瓶颈,其本地化的设计与优化手段对非Hadoop平台同样有效.通过在原型系统上的实验证明,Arion能够提升大数据处理任务的执行效率,最高达7.7%.
[Abstract]:The emergence of MapReduce and other computing frameworks has opened a new era for big data processing. Big data processing system, represented by Hadoop,Spark, has the advantages of large throughput, cross-platform, high scalability, and has been widely used. However, in order to avoid binding with specific operating systems and hardware platforms, the design and optimization of these systems are focused on computing models, scheduling algorithms and so on, which can not make full use of the advantages of the underlying platform. In this paper, a design and optimization method of big data processing system based on orthogonal decomposition is proposed. The system is decomposed into loosely coupled multi-functional orthogonal modules so that storage and processing functions can be separated out. To be able to use the underlying platform operating system or even hardware resources storage, execution engine, the original big data system degraded into a scheduling platform; Furthermore, the storage optimization strategy based on lock independent mechanism and the execution engine optimization strategy based on instruction super optimization are proposed. Taking Hadoop as the compatible and improved object, the prototype big data processing system Arion.Arion can not only maintain the advantages of cross-platform, high scalability of Hadoop, but also eliminate the bottleneck of task execution. Its localization design and optimization methods are equally effective for non-Hadoop platforms. The experiments on the prototype system show that Arion can improve the efficiency of big data's task execution, up to 7. 7%.
【作者单位】: 中国科学院计算技术研究所;北方工业大学计算机学院;
【基金】:国家自然科学基金项目(61202061,61202413) 中国科学院计算技术研究所创新课题项目(20146080)~~
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 任仓钰;尹和平;;测绘数据处理系统介绍[J];工程地质计算机应用;2000年02期

2 张建文,汤军社,李险峰;炉温均匀性测试数据处理系统的设计与实现[J];机械与电子;2004年09期

3 陈金刚;舒攀;;高校网上录取数据处理系统的设计与实现[J];广西工学院学报;2007年02期

4 马辉;;招生数据处理系统的设计与实现[J];安徽电子信息职业技术学院学报;2009年04期

5 刘育刚;;机关事务数据处理系统的设计与实现[J];哈尔滨船舶工程学院学报;1986年S1期

6 余粟,徐子远;社会调查数据处理系统[J];计算机应用;1987年05期

7 毛楚祥;;大型统计数据处理系统的设计和实现技术[J];计算机工程与应用;1988年09期

8 王玉闽,刘继先;电机型式试验微机自动检测数据处理系统的开发及研制[J];爆炸性环境电气防爆技术;1994年02期

9 汪珑,钟成,刘建军,王廷福,孙富立;铁道部客调数据处理系统[J];铁路计算机应用;1994年01期

10 马晓鹏;“59-701微机数据处理系统”使用中的改进[J];陕西气象;2002年01期

相关会议论文 前6条

1 朱新河;严新平;萧汉梁;;计算机辅助油液监测数据处理系统[A];第二届全国青年摩擦学学术会议论文专辑[C];1993年

2 郭丰宇;;数据处理系统的测试与安全性问题[A];第三次全国计算机安全技术交流会论文集[C];1988年

3 刘云生;代一尘;邓华锋;;流数据处理系统自适应机制研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

4 安艳辉;谢飞;付洪波;;基于CAD平台的城市部件普查数据处理系统研究[A];地理信息与物联网论坛暨江苏省测绘学会2010年学术年会论文集[C];2010年

5 彭宇;邹向荣;杨悦;;招生数据处理系统的研究与实现[A];中国高等教育学会教育信息化分会第十次学术年会论文集[C];2010年

6 方超;陈志伟;蔡聪波;陈忠;叶朝辉;;核磁共振数据处理系统的开发[A];第十六届全国波谱学学术会议论文摘要集[C];2010年

相关重要报纸文章 前1条

1 魏杰;录井数据处理系统软件通过专家评审[N];中国石油报;2004年

相关硕士学位论文 前10条

1 安云凤;基于云计算的氋铁数据处理系统的设计与实现[D];西南交通大学;2015年

2 邱奕炜;桂林市自动气象站数据处理系统的设计与实现[D];电子科技大学;2015年

3 丁铁凡;基于云计算的医疗数据处理系统的关键技术研究[D];华北理工大学;2015年

4 周圣添;商业银行审计信息数据处理系统的设计与实现[D];山东大学;2015年

5 程辙;基于任务的海量保险数据处理系统设计与实现[D];南京大学;2016年

6 蒲来春;北京振冲公司灌浆数据处理系统的设计与实现开发[D];电子科技大学;2013年

7 段恒;金融数据处理系统的设计与实现[D];北京邮电大学;2013年

8 史雅云;车载导航终端数据处理系统的研究与实现[D];北京邮电大学;2007年

9 莫玲芝;基于混合编程的电化学实验数据处理系统的设计与实现[D];湖南大学;2010年

10 苏向阳;电子警察采集数据处理系统的设计与实现[D];西安电子科技大学;2010年



本文编号:2300606

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2300606.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户17c18***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com