分布式NoSql数据库设计与实现及其在吉林社保查询系统中的使用
本文选题:rNoSql + 分布式数据库 ; 参考:《吉林大学》2014年硕士论文
【摘要】:rNoSql代表rafaello’s NoSql database,它是一个分布式的非关系型数据库系统,设计这个数据库的目的是为了处理吉林社保系统中数以百万的参保信息,这些数据将被分布放置在数百台普通的PC服务器上,其总容量可能达到PB级的。不同的应用对rNoSql提出的要求差异非常大,有些是在数据量上而另外一些是在响应速度上。尽管应用需求差异很大,,最总rNoSql仍旧提供了一个灵活并且高性能的解决方案。本论文将描述rNoSql提供的基础数据模型,利用这个模型,我们将可以动态的控制数据的分布和格式;我也将解释rNoSql的设计和实现过程。 rNoSql将自己管理的所有服务器组称作“数据群”,每个数据群又由一个或数个“数据子群”组成,子群的成员是“节点服务器”,节点服务器是rNoSql系统的最小单位,每个子群处理整个数据集合中的一部分内容,所有的子群和节点服务器在结构上都是平行单位,彼此独立处理事务. rNoSql在分布式架构上参考了流行的P2P软件如BT和电骡的一些设计,首先被启动的服务器被称作“种子服务器”或“根”服务器,其他服务器将根据种子服务器提供的种子创建,并加入到服务器群组中,但是其他节点服务器并不受种子服务器管理,所有节点服务器都可以动态的添加并且制定其负责的具体数据范围。 rNoSql的客户端通过种子服务器生成的种子文件与种子服务器建立连接,并且获得种子服务器保存的节点服务器列表,客户端遍历这个列表并且依次与这些节点建立连接,当查询业务发生时,客户端将同时与这些节点服务器发生联系,最后将这些节点服务器返回的结果汇总起来作为查询结果。 为了保证rNoSql与传统的关系型数据库的兼容性,rNoSql的数据模型被设计为与传统的关系型数据库类似,也提供了诸如“表”,“字段”以及“行”,“列”等相关概念,同时rNoSql提供了一个在语法和语义上与SQL语言类似的非关系型查询语言,被称作RQL(rNoSql Query Language),该语言提供了类似SQL的表达方式,例如select,from和where等关键字,并不支持多表关联查询,使用RQL,数据库操作人员可以更方便的操作rNoSql内部的数据,降低学习曲线,减小学习难度。 rNoSql的持久化是由其自身完成的,既一个rNoSql数据群本身使用另一个由rNoSql作为核心组件的分布式文件系统RFS(r`FileSystem)作为持久化工具,但是通常的,这个持久化工具只运行在本地的硬件环境上。 SVN:http://javaforge.com/svn/rNoSql 用户名:raffaello 密码:711004
[Abstract]:RNoSql stands for rafaello's NoSql database, a distributed, non-relational database designed to handle millions of insured information in Jilin's social security system. The data will be distributed over hundreds of ordinary PC servers, with a total capacity likely to reach PB level. The requirements of rNoSql for different applications vary greatly, some on the amount of data and others on the response speed. Despite the wide variety of application requirements, rNoSql still offers a flexible and high performance solution. This paper will describe the basic data model provided by rNoSql. With this model, we can dynamically control the distribution and format of data. I will also explain the design and implementation of rNoSql. RNoSql refers to all server groups it manages as "data groups," each of which is composed of one or more "data subgroups," the members of which are "node servers," The node server is the smallest unit of the rNoSql system, each subgroup handles part of the entire data set, and all subgroups and node servers are structurally parallel units. RNoSql refers to the design of popular P2P software such as BT and Emule on a distributed architecture. The server that is first started is called a "seed server" or "root" server. Other servers are created based on the seed provided by the seed server and added to the server group, but the other node servers are not managed by the seed server, All node servers can dynamically add and define the specific range of data they are responsible for. The client of rNoSql connects to the seed server through the seed file generated by the seed server. A list of node servers stored by the seed server is obtained, and the client traverses the list and establishes a connection with the nodes in turn. When the query business occurs, the client will contact the node server at the same time. Finally, the results returned by these node servers are summarized as query results. In order to ensure the compatibility of rNoSql with traditional relational databases the data model of rNoSql is designed to be similar to traditional relational databases and provides related concepts such as "tables", "fields" and "rows", "columns", etc. At the same time, rNoSql provides a non-relational query language that is syntactically and semantically similar to the SQL language, known as RQL (rNoSql query language). The language provides SQL-like expressions, such as select from and where keywords, and does not support multi-table association queries. With RQL, database operators can operate the data inside rNoSql more conveniently, reduce the learning curve and reduce the learning difficulty. The persistence of rNoSql is accomplished by itself. Both an rNoSql data set itself uses another distributed file system, RFS (r `File system), with rNoSql as the core component, but typically, SVN: http: / javaforge.comr / svn / rNoSql username: Raffaello password: 711004
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 郭颂东;;小型关系型数据库在企业管理中的应用实证研究[J];市场周刊(理论研究);2009年04期
2 李道航;;非关系型数据库对广播新媒体的应用与价值[J];中国传媒科技;2012年15期
3 吕刚;蒋勇铭;王军;;基于关系型数据库的树形结构设计与实现[J];计算机光盘软件与应用;2012年17期
4 李春林;;非关系型数据库在生物信息学中的应用分析[J];东方企业文化;2012年23期
5 胡贤金;;两种型式的关系型数据库[J];交通与计算机;1989年04期
6 刘英,郑玉琴,姜生国,于信文;用关系型数据库开发账务处理系统[J];纯碱工业;1993年04期
7 陈远,周朴雄;数据管理性能的折中方案——后关系型数据库[J];中国图书馆学报;2000年06期
8 桂琛;让Linux坚不可摧[J];中国计算机用户;2003年23期
9 石建武;李彬;史巍;;浅谈关系型数据库在网络中的运用[J];科技信息(学术研究);2007年27期
10 赵慧玲;田海萍;孙悦;;关系型数据库课程内容体系改革与实践[J];黑龙江教育(高教研究与评估);2011年10期
相关会议论文 前6条
1 胡凤国;侯敏;;关系型数据库在语音语料库中的应用[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 赵青;龚昊;;NoSQL推动新闻业务发展的应用研究[A];中国新闻技术工作者联合会2011年学术年会论文集(上篇)[C];2011年
3 陈航;;试论后关系型数据库Cach é在医疗行业的应用前景[A];中华医学会第十二次全国医学信息学术会议论文汇编[C];2006年
4 阎秀美;周亚建;胡正名;;关系型数据库中XML索引技术研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
5 于瑞祥;严隽薇;凌卫青;;关系型数据库与XML数据映射研究[A];全国先进制造技术高层论坛暨制造业自动化、信息化技术研讨会论文集[C];2005年
6 牛静涛;;略论基层软件的现状及发展[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
相关重要报纸文章 前10条
1 InterSystems大中国区技术总监 余衡;突破关系型数据库极限[N];中国计算机报;2005年
2 本报记者 周蓉蓉;后关系型数据库拓展生存空间[N];计算机世界;2005年
3 《网络世界》记者 于翔;NoSQL:大数据浪潮中崛起[N];网络世界;2012年
4 罗琼;“后”来居上[N];中国计算机报;2006年
5 编译 刘琦;云应用促开发思维转变[N];中国计算机报;2009年
6 本报特约撰稿人 王翔;超越传统:NoSQL横空出世[N];网络世界;2009年
7 张承东;CACHE2007: Web开发利器[N];网络世界;2006年
8 晓轩;Intersystems登陆?先搞定ISV再说![N];计算机世界;2004年
9 朱杰;后关系型数据库=XML+关系型?[N];中国计算机报;2007年
10 本报记者 吴蔚邋原诗萌;DB2第一个25年的时光漫步[N];中国计算机报;2008年
相关硕士学位论文 前10条
1 张国荣;基于关系型与非关系型数据库的电子表单系统设计与实现[D];中山大学;2012年
2 徐博;神经肿瘤关系型数据库的方案设计与临床应用[D];中国人民解放军军事医学科学院;2005年
3 李洋;基于关系型数据库的空间元数据管理方法研究[D];首都师范大学;2013年
4 孙建强;一种关系型数据库位图排序及实体连接算法[D];北京邮电大学;2010年
5 刘炜;一种基于NoSQL的并行数据增量处理机制研究[D];华中科技大学;2013年
6 夏勇;基于关系型数据库的粗糙集约简算法及实现[D];吉林大学;2006年
7 徐小威;非关系型数据库数据恢复技术研究[D];杭州电子科技大学;2014年
8 郑旭军;基于后关系型数据库的医疗体检数据挖掘的研究与应用[D];华东师范大学;2007年
9 谢晓锋;关系型数据库在XML存储与操作方面扩展的研究[D];华中科技大学;2005年
10 苏婵;非关系型数据库及在文档库管理平台中的研究与应用[D];南昌大学;2014年
本文编号:2098928
本文链接:https://www.wllwen.com/shekelunwen/shehuibaozhanglunwen/2098928.html