DOA下的数据注册中心元数据存储策略研究
本文选题:DOA + 元数据存储 ; 参考:《成都理工大学》2013年硕士论文
【摘要】:伴随国家信息化建设的快速发展,各种各类数据信息不断涌现,时时刻刻为人们的日常生活生产提供信息服务。Internet的全世界普及,使数据每一时刻都在网络中流动,使数据散落在不同的数据存储系统与设备中。为实现数据在客户端汇聚,G/S模式应运而生。它采用“请求(request)-聚合(Polymerization)-服务(Service)"机制对所有的数据信息服务过程进行组织与管理,在客户端实现数据信息汇聚和服务聚合。G/S模式解决了数据的汇聚问题,但是如何管理各种数据,G/S模式并没有提出有效的解决方法。为了能够更快更好的获取数据,为G/S模式服务,成都理工大学教授苗放老师提出了以数据为中心,以标识为主线的面向数据的体系结构——DOA,运用数据的元数据实现对数据的统一管理。要管理各种类型数据,首先要有相关数据的元数据,所以数据的元数据存储问题,成为了DOA首要考虑的问题。DOA要求数据注册中心能够快速提供数据的元数据信息,如何存储才能快速提供元数据,成为DOA下元数据管理数据的瓶颈,也是本文研究的问题,解决DOA下的数据注册中心元数据快速获取的存储问题,成为当务之急。本文首先对G/S模式和DOA进行了全面概述,分析了它们的层次结构与对数据汇聚和管理的作用,促使了对元数据存储策略的研究。通过对元数据标准和开发设计框架基础知识的概述,为设计了元数据存储规范准备了基础知识。本文的工作如下:(1)研究数据注册中心元数据存储策略由于DOA使用元数据统一管理各种数据,所以元数据的获取速度决定了DOA的性能。因而,如何存储元数据成为元数据快速获取的关键。在分析研究文件系统方式、LDAP目录存储方式、各种关系数据库存储方式和内存数据存储方式的存储优缺点的基础上,对使用何种存储方式才能使数据注册中心元数据被快速获取进行了分析研究。并依据研究成果,设计了一种能够实现元数据快速获取的元数据存储结构模型。(2)研究元数据存储的相关算法基于内存容量的大小和元数据被访问频率的问题,研究为内存提供存储元数据的相关算法。研究了一种基于代价函数的缓存替换算法,为数据注册中心在缓存中动态存储最近有可能被经常访问的元数据。同时进一步研究了在缓存中选取高访问频率元数据表的算法,以实现通常访问的元数据信息存入内存数据库。通过这两种算法,把访问频率高的元数据存入内存,提高了数据注册中心对元数据的获取速度。本文的创新点与研究成果有:(1)提出了一种DOA下的数据注册中心元数据快速获取存储策略。本元数据存储策略,依据DOA下的元数据统一管理数据的要求,利用关系数据库的存储容量、内存数据库的访问效率和缓存动态存储作用,通过基于代价的缓存替换算法实现在缓存中动态存储最近有可能被经常访问的元数据,以提高元数据的获取速度与积累元数据的被访问频率;再通过基于代价函数的缓存选取算法,选取缓存中访问频率最高的元数据表存入内存数据库,完成元数据的内存数据库存储。在此基础上,设计了DOA下的数据注册中心的元数据存储结构模型,并依据此模型设计了DOA下的数据注册中心元数据存储系统。(2)提出了一种数据注册中心的替换缓存中访问权值最低元数据表的算法。通过对现存的几种常用缓存替换算法分析研究,从函数的角度,利用缓存数据表大小、访问次数、访问时间和获取缓存数据表的CPU时间,设计了一种基于代价函数的缓存替换算法,实现最近有可能被经常访问的数据表在缓存中的存储。(3)提出了一种数据注册中心的选取高访问频率元数据表存入内存数据库的算法。在对现存缓存替换算法研究的基础上,从函数的角度,利用缓存数据表大小、访问次数、访问时间和访问密度,设计了一种基于代价函数的缓存数据表选取算法,实现高访问频率元数据表从缓存到内存数据库的存储。
[Abstract]:With the rapid development of national information construction, various kinds of data and information are constantly emerging. The information service of.Internet is popularized all the time for people's daily life. The data will flow in the network at every moment, so that data are scattered in different data storage and storage systems and equipment. G/S mode comes into being. It uses "request" - aggregation (Polymerization) - Service (Service) "mechanism to organize and manage all the data information service processes. The data aggregation problem is solved by data aggregation and service aggregation.G/S mode in the client, but how to manage all kinds of data, G/S mode is not In order to get the data faster and better, to serve the G/S mode faster and better, Professor Miao Fang of Chengdu University of Technology put forward a data centric, identification oriented data oriented architecture, DOA, using data metadata to realize the unified management of the logarithm data. First, to manage various types of data, first In order to have metadata of relevant data, the problem of metadata storage of data has become the primary concern of DOA..DOA requires that data registration center can provide metadata information quickly, how to store metadata quickly, become the bottleneck of metadata management data under DOA, and the problem of this paper, to solve DOA The fast acquisition of data registry metadata has become a top priority. This paper first gives a comprehensive overview of the G/S model and DOA, analyzes their hierarchical structure and the function of data convergence and management, and promotes the research of metadata storage strategy. The basic knowledge is prepared for the design of metadata storage specification. The work of this paper is as follows: (1) study the metadata storage strategy of data registration center because DOA uses metadata to manage all kinds of data, so the speed of metadata acquisition determines the performance of DOA. Therefore, how to store metadata is the key to the rapid acquisition of metadata. On the basis of analyzing the methods of file system, the storage mode of LDAP directory, the storage mode of all kinds of relational databases and the memory of memory data storage methods, this paper analyzes and studies what kind of storage methods used to make the metadata of the data registration center be obtained quickly. And a kind of realization is designed based on the research results. The metadata storage structure model is quickly acquired. (2) the related algorithms of metadata storage are based on the size of memory capacity and the frequency of the metadata being accessed, and the related algorithms for storing metadata for memory are studied. A caching replacement algorithm based on cost function is studied, which is used to move the data registry in the cache. State storage of metadata that may be frequently accessed recently. At the same time, the algorithm of selecting high access frequency metadata in the cache is further studied to save the commonly accessed metadata information into the memory database. Through these two algorithms, the metadata with high frequency of access is stored in the memory, and the data registry is improved to the metadata. The innovation points and research results of this paper are as follows: (1) a fast acquisition strategy for data registration center metadata under DOA is proposed. This metadata storage strategy is based on the requirements of unified management of data under the metadata under DOA, using the storage capacity of the relational database, the access efficiency of the memory database and the dynamic storage of the cache. Use the cost based cache replacement algorithm to dynamically store the most frequently accessed metadata that may be frequently accessed in the cache to improve the speed of metadata acquisition and the access frequency of the accumulated metadata; then, the cache selection algorithm based on the cost function is used to select the metadata with the highest access frequency in the cache and save the memory. On the basis of this, the metadata storage structure model of the data registration center under DOA is designed, and the data registration center metadata storage system under DOA is designed based on this model. (2) a calculation of the minimum metadata table of access weight in the replacement caching of the data registration center is proposed. By analyzing several existing common cache replacement algorithms, from the point of view of function, using the size of the cached data table, the number of access, access time and the CPU time of obtaining the cached data table, a cache replacement algorithm based on the cost function is designed to realize the storage of the data table that may be frequently accessed recently in the cache. (3) an algorithm for selecting the high access frequency metadata table to be stored in the memory database is proposed. On the basis of the existing cache replacement algorithm, a cost function based caching data table is designed from the function point of view, using the size of the cached data table, access times, access time and access density. The algorithm implements the storage of high access frequency metadata tables from cache to memory database.
【学位授予单位】:成都理工大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP333
【相似文献】
相关期刊论文 前10条
1 于海燕,周顺平;空间元数据系统的研究与设计[J];现代计算机(专业版);2002年09期
2 吕秋培,解素芳,李新利,卢晓慧,任凤仙,于慧敏,刘彩霞,陈晓;关于元数据及其应用[J];档案学通讯;2003年03期
3 王继周,李成名,林宗坚;面向共享的空间元数据管理框架研究与设计[J];国土资源遥感;2003年03期
4 李双文;;论元数据的概念、层次和作用[J];云南档案;2009年09期
5 杨茹;张爱文;;黑龙江省交通数字化中元数据创建问题研究[J];黑龙江工程学院学报(自然科学版);2010年03期
6 曹树金,马利霞;描述教育资源的元数据标准[J];大学图书馆学报;2004年02期
7 熊志刚,徐梅林;基于元数据及语意网的学习技术探讨[J];开放教育研究;2004年05期
8 袁平,韩景润,党海飞;空间元数据自动生成技术研究[J];地理信息世界;2005年01期
9 李晓霞;;元数据在空间信息网上发布中的实现方法与应用[J];计算机时代;2006年04期
10 傅海洋;黄俊;刘晓晨;;物流元数据及其管理研究[J];物流科技;2008年10期
相关会议论文 前10条
1 赵培翔;张铭;杨冬青;唐世渭;;数字化文档元数据的自动提取[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
2 陈胜鹏;邱文;;基于元数据的空间地理信息管理系统整合的研究与实现[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
3 万甜甜;刘强;董海良;;西南资源环境信息元数据研究[A];第四届海峡两岸GIS发展研讨会暨中国GIS协会第十届年会论文集[C];2006年
4 白云;高国勇;;基于Web的城市地下管线元数据共享机制的研究[A];吉林省测绘学会2008年学术年会论文集(上)[C];2008年
5 殷宁欣;张卫平;张涛;;空间信息系统中的模型方法元数据标准研究[A];吉林省测绘学会2008年学术年会论文集(上)[C];2008年
6 韩先培;赵军;;基于Wikipedia的语义元数据生成[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
7 王蜀安;张铭;王爱华;杨冬青;;构建基于OAI协议的可互操作数字图书馆元数据服务[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 廖轶;黄磊;袁芳;;元数据在高校数据中心的应用探索[A];中国高等教育学会教育信息化分会第十二次学术年会论文集[C];2014年
9 徐佳沅;;规划信息数据库的元数据集成管理研究[A];广东省测绘学会第九次会员代表大会暨学术交流会论文集[C];2010年
10 陈X;李心科;;基于可扩展数据清理框架的元数据的研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
相关博士学位论文 前5条
1 刘海学;基于语义标注的元数据自动构建及其相关技术研究[D];华东师范大学;2010年
2 符海芳;网络地理信息组织和提取的研究及其在农业信息中的应用[D];中南大学;2003年
3 辜寄蓉;基于元数据的综合数据管理与信息共享[D];成都理工大学;2003年
4 徐昊;科技知识对象的语义模式研究[D];吉林大学;2013年
5 王霞;卫生统计调查元数据概念模型的研究[D];第四军医大学;2006年
相关硕士学位论文 前10条
1 安静;基于元数据动态获取的数据质量检查技术[D];中国地质大学(北京);2015年
2 李欣;交通物流信息平台元数据研究与应用[D];长安大学;2015年
3 施伟;高性能分布式文件系统元数据服务设计与实现[D];电子科技大学;2014年
4 吕鹏程;一个分布式文件系统元数据服务器设计与实现[D];电子科技大学;2015年
5 赵卓;禽肉质量安全追溯元数据研究[D];河北科技师范学院;2014年
6 秦超;本体元数据设计、提取及应用[D];南京大学;2014年
7 白雷;云存储中独立元数据的设计与实现[D];西安电子科技大学;2014年
8 袁进俊;DOA下分布式DRC的元数据分级存储模型研究[D];成都理工大学;2015年
9 张雷;DOA下的数据注册中心元数据存储策略研究[D];成都理工大学;2013年
10 高小明;国家基础地理信息动态元数据管理系统的研究与实现[D];武汉大学;2005年
,本文编号:1912781
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1912781.html