当前位置:主页 > 科技论文 > 软件论文 >

高能物理大数据挑战与海量事例特征索引技术研究

发布时间:2018-04-09 20:08

  本文选题:高能物理 切入点:数据管理 出处:《计算机研究与发展》2017年02期


【摘要】:新一代高能物理实验装置的建成与运行,产生了PB乃至EB量级的数据,这对数据采集、存储、传输与共享、分析与处理等数据管理技术提出了巨大挑战.事例是高能物理实验的基本数据单元,一次大型实验即可产生万亿级的事例.传统高能物理数据处理以ROOT文件为基本存储和处理单位,每个ROOT文件可以包含数千至数亿个事例.这种基于文件的处理方式虽然降低了高能物理数据管理系统的开发难度,但物理分析仅对极少量的稀有事例感兴趣,这导致了数据传输量大、I?O瓶颈以及数据处理效率低等问题.提出一种面向事例的高能物理数据管理方法,重点研究海量事例特征高效索引技术.在这种方法中,将物理学家感兴趣的事例的特征量抽取出来建立专门的索引,存储在NoSQL数据库中.为便于物理分析处理,事例的原始数据仍然存放在ROOT文件中.最后,通过系统验证和分析表明,基于事例特征索引进行事例筛选是可行的,优化后的HBase系统可以满足事例索引的需求.
[Abstract]:The establishment and operation of a new generation of high-energy physics experimental devices have produced PB and EB order of magnitude data, which poses a great challenge to data acquisition, storage, transmission and sharing, analysis and processing and other data management technology.Example is the basic data unit of high energy physics experiment. A large experiment can produce trillion-scale examples.Traditional high energy physical data processing takes ROOT file as the basic storage and processing unit. Each ROOT file can contain thousands to hundreds of millions of examples.Although this kind of file-based processing method reduces the difficulty of developing high energy physics data management system, physical analysis is only interested in a few rare cases, which leads to the bottleneck of large amount of data transmission and the low efficiency of data processing.A case oriented high energy physics data management method is proposed.In this method, the features of the case of interest to physicists are extracted to build a special index and stored in the NoSQL database.For ease of physical analysis, the raw data of the case is still stored in the ROOT file.Finally, the system verification and analysis show that case filtering based on case feature index is feasible, and the optimized HBase system can meet the needs of case index.
【作者单位】: 中国科学院高能物理研究所;西安交通大学计算机科学与技术系;中国科学院计算技术研究所;中国科学院信息工程研究所;
【基金】:国家重点研发计划项目(2016YFB1000604)~~
【分类号】:O572;TP315

【相似文献】

相关期刊论文 前10条

1 郑伟平;;基于局部供求平衡的P2P流媒体数据缓存[J];华南师范大学学报(自然科学版);2013年04期

2 谢强;于雅丽;丁秋林;;基于对象池和数据缓存技术的Web-OLAP系统[J];应用科学学报;2007年02期

3 何清;;大数据与云计算[J];科技促进发展;2014年01期

4 刘珍;李运楼;;ADO.NET DataSet中数据的访问与修改[J];科技广场;2007年03期

5 李滨;侯小牛;常德海;陈欣;;.Net环境下空间数据缓存方案的设计与实现[J];海洋测绘;2009年03期

6 施为;;Web应用程序中的数据缓存技术分析[J];淮阴师范学院学报(自然科学版);2006年04期

7 刘禹;吴彦波;孟广仕;;一种锁无关的数据缓存方法[J];黑龙江科技信息;2012年23期

8 陆锋;张恒才;;大数据与广义GIS[J];武汉大学学报(信息科学版);2014年06期

9 王欣;周南;邱小彬;;JCS数据缓存技术在动态Web系统中的应用[J];中山大学学报(自然科学版);2009年S1期

10 董卫华;刘纪平;郭庆胜;;基于.Net平台和Web Service技术的政府GIS的构建[J];辽宁工程技术大学学报;2007年05期

相关会议论文 前3条

1 石磊;陈晓敏;朱岩;李昆;;基于SDRAM的高速数据缓存的FPGA控制实现[A];第二十三届全国空间探测学术交流会论文摘要集[C];2010年

2 孙凌;高西奇;;FUTURE系统中MT侧RLC层的设计与实现[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年

3 蔡海兴;符影杰;;基于Windows CE串行通信实现现场抄表[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年

相关重要报纸文章 前6条

1 王志强;银行应用系统间的数据交换[N];计算机世界;2005年

2 陈代寿;网管不言愁[N];中国计算机报;2000年

3 本报记者 谌力;整合 从实时数据处理开始[N];网络世界;2004年

4 易成;平安在上海深圳设立数据中心[N];中国保险报;2004年

5 ;数据库的动态性能调优[N];计算机世界;2002年

6 子言 王春秋 本报记者 姚睿;智能手机“芯”情报告[N];计算机世界;2003年

相关博士学位论文 前3条

1 殷君茹;分布式并行环境下林地落界数据快速统计技术研究[D];中国林业科学研究院;2015年

2 韩晶;大数据服务若干关键技术研究[D];北京邮电大学;2013年

3 苗艳超;数字视频服务关键技术研究[D];中国科学院研究生院(计算技术研究所);2004年

相关硕士学位论文 前10条

1 谭云;数据命名网络上的一种存储高效可并行的数据名查找方案[D];暨南大学;2015年

2 刘汀枝;基于Coherence的债券数据缓存服务系统设计[D];复旦大学;2014年

3 周学安;基于IEEE1394b数据光传输模块研制[D];哈尔滨工业大学;2015年

4 覃馨;基于最终一致性的数据缓存策略研究与设计[D];大连海事大学;2015年

5 周琼;基于大数据的新闻管理系统的设计与实现[D];复旦大学;2014年

6 赵亚芳;高速可定时数据合成模块设计[D];电子科技大学;2014年

7 任亮;油气田钻采数据转换系统的设计与实现研究及实现[D];中国科学院大学(工程管理与信息技术学院);2015年

8 赵振东;定向互联网站点数据爬虫及应用服务接口的设计与实现[D];南京大学;2014年

9 杨光阳;基于FPGA的硬件千兆网络通信设计[D];电子科技大学;2015年

10 张彦怡;房地局统一数据服务平台系统的设计与实现[D];电子科技大学;2014年



本文编号:1727946

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1727946.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户30442***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com