面向天文学领域的大数据管理的研究与实现
本文关键词:面向天文学领域的大数据管理的研究与实现 出处:《哈尔滨工业大学》2013年硕士论文 论文类型:学位论文
更多相关文章: 甲骨文真正应用集群 数据库 索引 分区 数据库优化 并行查询
【摘要】:近年来,随着云计算,云存储等概念的提出,在人们的日常生活及各方面的专业领域中会产生大量的数据。在天文学领域,近年来提出一个新的项目叫做大型综合巡天望远镜,旨在持续观测整个天空数十年,将相关数据记录下来以供分析研究。在项目持续的十年中,大约会将项目产生的60PB数据存储到服务器中供大众以及天文学家分析以揭示新的天空,对整个宇宙做出新的发现。相应地,60千万亿字节相对于现存的各种大型数据库管理系统来说是一项巨大的挑战。 传统的主流数据库管理软件如Microsoft SQL Server,MySQL等已不适用于大数据处理业务,因此,出现了一些新的技术以提高对大数据的处理。一种可行的方案是将数个成本脚较低的计算机组成集群以提供并行服务如Oracle的Real Application Cluster,,IBM DB2,Hive,HadoopDB等,这种手段虽然具有相对较低的成本,但是却增加了运行环境的复杂程度,以及用于并行的额外开销。在分析此项目对于数据库管理系统的需求,以及学习,理解甲骨文数据库管理系统中提供的索引,分区,并行查询等技术后,本文将会对甲骨文真正应用程序集群的数据库性能进行一番优化,测试以观测现存的甲骨文真正应用程序集群是否能满足项目的需求。另外,本文还将对比查询语句在甲骨文真正应用程序集群以及在相同情况下其他数据库管理系统中的表现。本文还将就甲骨文真正应用程序集群的可扩展性进行一番测试,以观测甲骨文真正应用程序集群是否能很好的支持添加,扩展集群,以及其容错性,可伸缩性,可用性。相应地,为了更好的测试查询语句在甲骨文数据库管理系统中的性能,一个辅助的软件将会被开发出来以便简化测试查询性能的流程,减小工作量。 在实际应用当中,本文会提供结合索引,分区,并行等技术的策略来对现存的数据库进行优化。而且,作为大型巡天望远镜项目的一部分,此部分优化策略对大型巡天望远镜现存的数据库管理系统来说也会有一定的意义。辅助测试数据库性能的软件也将可以被本项目组测试其他数据库系统性能的工程师直接使用。
[Abstract]:In recent years, with the introduction of cloud computing, cloud storage and other concepts, in the daily life of people and in all aspects of the professional field will produce a lot of data, in the field of astronomy. In recent years, a new project, called the large Integrated Sky Survey Telescope, has been proposed to continuously observe the entire sky for tens of years and record the relevant data for analysis and research. Approximately 60 PB of data generated by the project will be stored in servers for public and astronomer analysis to reveal new skies and make new discoveries across the universe. 60 trillion bytes is a huge challenge compared to existing large database management systems. The traditional mainstream database management software such as Microsoft SQL Server MySQL is no longer suitable for big data processing business. New technologies have emerged to improve the handling of big data. A viable solution would be to cluster several lower-cost computers to provide parallel services such as Oracle's Real. Application Cluster. Although IBM DB2Hiveer Hadoop DB and so on, this method has relatively low cost, but it increases the complexity of the running environment. After analyzing the requirements of the project for the database management system, and learning, understanding the Oracle database management system provided in the index, partition, parallel query and other technologies. This article will optimize the database performance of Oracle's real application cluster to test whether the existing Oracle real application cluster can meet the requirements of the project. This article will also compare the performance of query statements in Oracle real application cluster and other database management systems in the same situation. We will also test the extensibility of Oracle real application cluster. Try. To see if Oracle's real application cluster supports addition, extension, and fault tolerance, scalability, availability, and so on. In order to better test the performance of query statements in Oracle database management system, an auxiliary software will be developed to simplify the process of testing query performance and reduce the workload. In practical applications, this article will provide a combination of indexing, partitioning, parallelism and other techniques to optimize existing databases, and as part of a large survey telescope project. This part of the optimization strategy will also have some significance for the existing database management system of the large survey telescope. The software to assist in testing database performance will also be able to be used by the project team to test the performance of other database systems. The teacher uses it directly.
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:P11;TP311.52
【相似文献】
相关期刊论文 前10条
1 吴宗成,朱自强,陈泽民;一种交互式分区网格的生成方法和软件[J];航空学报;1999年03期
2 张锦明,何成;利用分区思路优化拓扑关系自动生成算法[J];测绘学院学报;2000年02期
3 屠其璞,邓自旺,周晓兰;中国气温异常的区域特征研究[J];气象学报;2000年03期
4 郜邦勋;铜仁地区夏季降水的环流成因分析及预报[J];贵州气象;2000年06期
5 王秀红,何书金,张镱锂,罗明;基于因子分析的中国西部土地利用程度分区[J];地理研究;2001年06期
6 张侠,葛向东,彭补拙;土地经营适度规模的初步研究[J];经济地理;2002年03期
7 槐瑞托,牛丽静,管振龙;大鼠中脑导水管周围灰质的分区及其细胞构筑特点[J];河北师范大学学报(自然科学版);2002年04期
8 牛丽静,槐瑞托,管振龙;大鼠前庭核群亚核界定及其投射联系[J];河北师范大学学报(自然科学版);2002年06期
9 徐涛;三明旅游资源的定量评价与分区[J];三明高等专科学校学报;2002年02期
10 田润暹,胡胶脐;山西省岩溶大泉主要特征及其开发利用程度分区[J];山西水利;2002年S1期
相关会议论文 前10条
1 ;Storage of XML in Compressed Relational Database[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 Grace wai-yue Leung;;Databases as Virtual XML Documents:an Interoperable Approach[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
3 Leong Long Kam;;Database Technology Development[A];数据库研究进展97——第十四届全国数据库学术会议论文集(上)[C];1997年
4 黄志敏;;ASD:a comprehensive database of allosteric proteins and modulators[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
5 宫秀军;赵菲菲;;DM-TIGER:A Database of Tissue-Specific Genes Expression and Regulatory Factors for Data Mining[A];第四届全国生物信息学与系统生物学学术大会论文集[C];2010年
6 ;Technology for Creating XML Views of Relational Database[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
7 张延松;张宇;薛永生;;基于XML DATABASE的网格数据库物化查询缓存机制[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
8 杨晓勤;梁爽;;VeryGene:a database linking tissue specific genes to diseases,drugs and beyond[A];第四届全国生物信息学与系统生物学学术大会论文集[C];2010年
9 秦燕峰;刘亚军;;基于多文档和动态链接库技术的软件开发方法研究与实现[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
10 ;The Role of Historical Database in Geological Engineering[A];中国科学院地质与地球物理研究所二○○三学术论文汇编·第三卷(地球环境·工程地质与灾害)[C];2003年
相关重要报纸文章 前10条
1 ;区域、不分区“立委”提名皆可谈[N];团结报;2011年
2 南京市食品药品监督局白下分局 焦利萍 江苏省人民政府法制办公室 马太建;分区立法的可行性分析[N];江苏法制报;2010年
3 记者 王丽;黔“两屏五带”将“分区保护”[N];新华每日电讯;2011年
4 记者 罗铮;中国与有关各方就分区护航国际合作达成原则共识[N];解放军报;2010年
5 记者 魏广军 实习生 何思远;我市将分区创建国家卫生城市[N];平顶山日报;2009年
6 本报记者 周强 本报通讯员 祝贺;瞄准深部外围 分区分批推进[N];中国国土资源报;2010年
7 记者 魏广军;我市强力推进分区创建[N];平顶山日报;2010年
8 本报记者 毕玉娟 张恭;分区治水破瓶颈 润泽塞上新天府[N];中国水利报;2010年
9 伍_g_g;第三届山西品牌节太原分区展示商标兴市魅力[N];中国知识产权报;2009年
10 CBN记者 王佑;金山、奉贤两化工分区并入上海化工区[N];第一财经日报;2009年
相关博士学位论文 前10条
1 鲁万;数据挖掘环境中隐私保护数据共享混合方法研究[D];大连海事大学;2013年
2 刘艳艳;基于数据库集群的海洋环境数据优化存储与分布式管理[D];中国海洋大学;2008年
3 刘培强;两元矩阵聚类算法研究[D];山东大学;2013年
4 王新宇;大型遗留系统再工程研究[D];浙江大学;2007年
5 邵晓梅;黄河流域节水农业关键问题的区域特征研究[D];中国农业科学院;2005年
6 楼向雄;Mass-Storage SOC片上集成系统研究与实现[D];浙江大学;2004年
7 高云君;时空数据库查询处理关键技术研究[D];浙江大学;2008年
8 刘棣华;网络入侵检测系统及其自适应性的研究与实现[D];东华大学;2009年
9 张臻;西南季节性干旱区农业资源与环境要素数据库设计与应用[D];西南大学;2011年
10 李洪宁;万维网地理信息系统分布式理论体系研究与实现[D];中国地质大学(北京);2003年
相关硕士学位论文 前10条
1 姚菁华;面向天文学领域的大数据管理的研究与实现[D];哈尔滨工业大学;2013年
2 萨姆松;[D];东华大学;2012年
3 阿廖娜(Buga Alena);一个电子商务应用系统的实现[D];哈尔滨工业大学;2013年
4 杨锦涛;电力系统环境下的网络时间同步系统的研究与实现[D];湖南大学;2011年
5 张静伟;网络能耗监测系统管理端的研究与实现[D];北京邮电大学;2012年
6 刘军;基于SIP协议的可视终端与服务器的研究与实现[D];北京邮电大学;2012年
7 程林;面向用户体验的无线网优指标展现模块的研究与实现[D];北京邮电大学;2012年
8 马少兵;数字图书馆私有云基础设施的构建和应用研究与实现[D];北京邮电大学;2012年
9 魏斌;农村信息化中虹终端交互设备的研究与实现[D];山东大学;2011年
10 王楠;Openflow网络中路由机制的研究与实现[D];北京邮电大学;2012年
本文编号:1358036
本文链接:https://www.wllwen.com/kejilunwen/tianwen/1358036.html