基于内存计算技术的企业海量财务数据实时分析
本文关键词:基于内存计算技术的企业海量财务数据实时分析 出处:《复旦大学》2013年硕士论文 论文类型:学位论文
【摘要】:存储在企业内部计算机系统之中的日益增长的财务数据暗藏着诸多有价值的信息。在不断变化的数据分析这一需求下,当这些待分析的数据的量大到一定程度之后,如何实施数据分析操作并实时获得结果正日益成为一个挑战。若使用传统方法,分析操作被发起之后,往往需要等待一段不短的时间,从几十分钟到几天不等,待系统处理结束之后才得到结果。这样实时性需求无法得到满足。为了缩短处理时间,有些系统采取预生成预先定义维度的物化的中间汇总结果这一技术,这样只能支持预先定义维度的相关信息的快速获取,无法满足灵活多变地任选维度进行数据分析的需求。 内存计算技术是目前比较热门的技术话题。它采用列方式将数据存储在磁盘中,并且将数据按列压缩。运行时数据全部加载到计算机主存中。在数据操作过程中,一旦数据被需要时立即从主存加载到中央处理器缓存中被处理,相对于传统方法中数据被需要时,先从磁盘加载到主存,然后再从主存加载到中央处理器缓存,大大减少了中央处理器因等待数据而空闲的时间。同时它充分利用计算机中央处理器的多内核,并行处理数据操作。这样大大缩短一次数据分析操作的所需时间。 除了从磁盘到中央处理器缓存的数据加载过程这一影响性能的瓶颈之外,另一个瓶颈是:在当前流行的三层企业系统架构体系下,数据总是需要在数据层和逻辑层之间双向传递多次,当数据量达到海量时,这对性能的消耗相当可观。内存计算技术提供在数据层进行内存计算的能力,逻辑层和数据层之间的界限被去除,大大减少大数据传递所带来的性能损耗。 本文在分析内存计算技术及其实现框架之后,提出了一个两层架构的企业海量财务数据实时分析系统。以两层架构中的数据层为重点,首先详细阐述系统要分析的数据对象,接着明确系统的设计原则,确定系统功能与界限,提出系统设计方案,然后详细讨论系统实现的主要部分:数据层模型视图,最后通过比较测试证明内存计算技术在企业海量财务数据实时分析领域的价值。
[Abstract]:The growing financial data stored in the internal computer system of the enterprise contains a lot of valuable information. When the amount of data to be analyzed is large enough, how to implement the data analysis operation and obtain the results in real time is becoming a challenge day by day. If the traditional method is used, the analysis operation will be initiated. It is often necessary to wait for a long time, ranging from dozens of minutes to a few days, until the system process is finished before the results can be obtained. Thus, the real-time requirements can not be met, in order to shorten the processing time. Some systems adopt the technique of pre-generating the intermediate aggregate results of the materialization of predefined dimensions, which can only support the rapid acquisition of relevant information of the predefined dimensions. Can not meet the flexible optional dimensions for data analysis. Memory computing technology is a hot topic at present. It uses column method to store data on disk. And the data is compressed by column. The runtime data is loaded into the main memory of the computer.; during the data operation, the data is loaded from the main memory into the central processing unit cache as soon as the data is needed. When data is needed relative to traditional methods, it is loaded from disk to main memory and then from main memory to central processor cache. It greatly reduces the central processor's idle time due to waiting for data, and makes full use of the multi-kernel of the computer's central processor. Parallel processing of data operations. This greatly reduces the time required for a data analysis operation. In addition to the performance bottleneck of the data loading process from disk to CPU cache, another bottleneck is: under the current popular three-tier enterprise system architecture. Data always needs to be transferred between the data layer and the logic layer for many times. When the amount of data reaches a large amount of data, the performance consumption is considerable. Memory computing technology provides the ability to compute memory in the data layer. The boundary between logical layer and data layer is removed, greatly reducing the performance loss caused by big data transfer. After analyzing the memory computing technology and its implementation framework, this paper puts forward a real-time analysis system of enterprise magnanimity financial data with a two-tier architecture, focusing on the data layer in the two-tier architecture. Firstly, the data objects to be analyzed are described in detail, then the design principles of the system are defined, the functions and limits of the system are determined, and the design scheme of the system is put forward. Then the main part of the system implementation: data layer model view is discussed in detail. Finally, the value of memory computing technology in the field of real-time analysis of massive financial data is proved by comparison test.
【学位授予单位】:复旦大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP333
【相似文献】
相关期刊论文 前10条
1 ;全球计算技术最新动态[J];个人电脑;2003年08期
2 ;《航空计算技术》征稿简则[J];航空计算技术;2005年02期
3 闫振林,贾兴红;瘦客户/服务器计算技术及实现[J];控制工程;2005年S2期
4 ;《航空计算技术》征稿简则[J];航空计算技术;2006年02期
5 ;计算技术与计算机及网络设备[J];电子科技文摘;2006年04期
6 蒋丽斌;王东;;高校《计算技术》课堂教学创新研究[J];企业家天地;2006年12期
7 黄铂;胡燕妮;;64位与32位计算技术优势比较[J];软件导刊;2006年23期
8 ;《航空计算技术》征稿简则[J];航空计算技术;2007年01期
9 ;《航空计算技术》征稿简则[J];航空计算技术;2007年02期
10 ;《航空计算技术》征稿简则[J];航空计算技术;2008年05期
相关会议论文 前10条
1 王希诚;;力学与计算技术的互动发展[A];力学史与方法论论文集[C];2003年
2 闫振林;贾兴红;;瘦客户/服务器计算技术及实现[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
3 王希诚;;力学与计算技术的互动发展[A];力学史与方法论论文集[C];2003年
4 夏朝晖;;欣欣向荣、迅猛发展的计算技术期刊[A];第三届中国科技期刊青年编辑学术研讨会论文集[C];2003年
5 王绍玲;李苹;;发展才是硬道理——记《物探化探计算技术》期刊的发展之路[A];科技编辑出版研究文集(第八集)[C];2005年
6 郑耀;;计算技术在航空航天领域中的应用[A];首届全国航空航天领域中的力学问题学术研讨会论文集(下册)[C];2004年
7 蔡皖东;;基于存储域网络的群集计算技术及其应用[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
8 郭乐深;苏森;;P2P计算技术综述[A];第六届全国计算机应用联合学术会议论文集[C];2002年
9 李小定;李耀会;;测定轻元素配位状态的X射线荧光光谱法及其应用[A];中国地质科学院南京地质矿产研究所文集(40)[C];1989年
10 娜仁;;学习珠算技术的必要性[A];中国珠算协会学术研究专业委员会2004年年会暨理论研讨会论文集[C];2004年
相关重要报纸文章 前10条
1 冯馨(清华大学新闻与传播学院博士);达·芬奇与新计算技术的革命[N];中国图书商报;2006年
2 ;空间计算技术让生活更美好[N];计算机世界;2005年
3 方金云 博士;空间计算技术应对挑战[N];计算机世界;2005年
4 中国科学院计算技术研究所 申排伟 张林广 张进 方金云;空间计算技术服务智通交通[N];计算机世界;2005年
5 胡永生;笔式操作平台与新计算技术[N];科技日报;2006年
6 本报记者 张翼南;这里,浓缩着计算技术的发展轨迹[N];人民日报海外版;2001年
7 本报记者 滕继濮;以人为本成为计算技术新方向[N];科技日报;2011年
8 章台柳;消费者们真的需要高技术吗?[N];中国经济导报;2012年
9 本报记者 金小鹿;可穿戴计算走秀不断[N];中国计算机报;2013年
10 ;如何让64位计算无处不在[N];计算机世界;2003年
相关博士学位论文 前1条
1 周斌;基于高级计算技术的客户行为刻画的工业产品感官评估研究[D];东华大学;2006年
相关硕士学位论文 前7条
1 黄鑫;中国第一个计算技术规划及其影响[D];内蒙古师范大学;2010年
2 吴超莉;基于虚拟计算技术的网上虚拟实验室架构的研究与实现[D];南京理工大学;2011年
3 徐建军;基于分布对象的WEB计算技术研究与实现[D];西北工业大学;2001年
4 刘江沙;基于内存计算技术的企业海量财务数据实时分析[D];复旦大学;2013年
5 沈玉琳;通用GPU计算技术在高性能计算平台上的应用研究[D];兰州大学;2012年
6 杨旭;主谓关系识别与主题相关性计算技术研究[D];东北大学;2009年
7 彭勇;基于J2EE的企业计算技术的研究与应用[D];河海大学;2002年
,本文编号:1438630
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1438630.html