基于宽表的多租户数据存储模式研究
发布时间:2017-07-18 03:15
本文关键词:基于宽表的多租户数据存储模式研究
更多相关文章: 多租户 数据存储模式 扩展表 关系代数 I/O代价
【摘要】:多租户数据存储是软件及服务(SaaS,Software as a Service)中一个重要的研究内容。针对SaaS应用“单实例多租赁”的特点,人们提出了很多解决多租户数据存储问题的方法,其中基于关系型数据库模式映射的宽表存储是一种常用、有效的SaaS多租户数据存储的解决方法。但为了保证租户的定制需求,宽表存储往往需要预留足够的列,导致数据具有很大的稀疏性,同时模式映射较为复杂,影响数据空间利用率和查询效率。 本文针对多租户数据宽表存储方法在数据空间利用率和查询效率方面的不足,提出一种基于宽表的多扩展表数据存储机制,并且在此基础上提出一种通用的多租户数据存储模式的数据查询效率评估方法,,以此评估多扩展表数据存储模式与其他存储模式的数据查询效率。本文的主要工作如下: (1)提出多扩展表数据存储结构。在宽表数据存储模式的基础之上加以改进,采用基本表与扩展表结合方式代替原有的单一宽表解决多租户数据存储问题。扩展表采用多个列数不同的表满足租户不同的定制需求,将租户的定制数据分配到合适的扩展表中,以最大限度的减少空值,提高数据存储的空间利用率。通过计算数据稀疏度,该模式有效的降低了数据的稀疏性。 (2)提出多扩展表方法中的模式映射机制。该机制包括基于业务数据的正态分布多扩展表划分方法和基于预留列的多扩展表选择方法,对多租户的数据进行合理的存储,以及租户逻辑数据到物理存储位置的映射。 (3)提出一种基于关系代数的多租户存储模式查询性能评估方法。通过建立租户私有表数据与物理存储数据的SQL定义,将SQL转换为关系代数,利用关系代数估计查询操作的I/O代价。将多租户存储模式的查询性能转化为I/O查询代价的比较,从而评估多租户数据存储模式的查询性能。该方法将多租户数据模式的查询性能评估从实验设计和硬件环境中分离,从本质上比较存储模式的优劣。实验表明,该方法虽然不能精确计算数据模式的查询成本,但是对于数据模式之间的查询性能对比有着显著的效果。
【关键词】:多租户 数据存储模式 扩展表 关系代数 I/O代价
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP333
【目录】:
- 摘要4-5
- Abstract5-7
- 目录7-10
- 图的目录10-11
- 1 引言11-16
- 1.1. 研究背景11-12
- 1.2. 国内外研究现状分析12-14
- 1.2.1 SaaS 模式的研究现状12-13
- 1.2.2 多租户数据存储模式研究现状13-14
- 1.3. 研究内容14-15
- 1.4. 论文结构15-16
- 2 相关技术16-25
- 2.1 SaaS 简介16-17
- 2.1.1 SaaS 概念16
- 2.1.2 SaaS 与 SOA16-17
- 2.1.3 多租户简介17
- 2.2 多租户数据模式17-23
- 2.2.1 私有表方法17-18
- 2.2.2 扩展表方法18
- 2.2.3 Key-value 方法18
- 2.2.4 宽表方法18-21
- 2.2.5 多宽表方法21-23
- 2.3 关系代数的性能评估方法23
- 2.4 空间利用率的评估方法23-24
- 2.5 本章小结24-25
- 3 基于宽表的数据存储机制25-45
- 3.1 多扩展表数据存储模式25-29
- 3.2 多扩展表存储机制的模式映射29-34
- 3.2.1 多扩展表的划分29-31
- 3.2.2 租户数据信息持久化31-34
- 3.3 多扩展表模式的查询重写34-37
- 3.3.1 私有表 SQL 定义的生成35-36
- 3.3.2 私有表 SQL 定义缓存管理器36-37
- 3.3.3 查询重写37
- 3.4 多扩展表模式的 Basic 缓存管理37-41
- 3.5 实验分析41-44
- 3.5.1 数据存储空间利用率分析41-42
- 3.5.2 查询效率分析42-44
- 3.6 本章小结44-45
- 4 基于关系代数的多租户数据存储模式性能评估方法45-53
- 4.1 视图定义45-47
- 4.2 SQL 到关系代数的转化算法47-48
- 4.3 关系代数评估方法48-50
- 4.4 评估验证及实验分析50-52
- 4.4.1 实验平台50-52
- 4.5 本章小结52-53
- 5 总结与展望53-56
- 5.1 总结53-54
- 5.2 展望54-56
- 参考文献56-59
- 致谢59-60
- 个人简历60
- 在读期间发表的论文及参与的项目60
- 发表论文60
- 参与项目60
【参考文献】
中国期刊全文数据库 前4条
1 刘玉葆;黄志兰;傅慰慈;印鉴;;基于有损分解的数据隐私保护方法[J];计算机研究与发展;2009年07期
2 孔兰菊;李庆忠;史玉良;王学;;面向SaaS应用基于键值对模式的多租户索引研究[J];计算机学报;2010年12期
3 姚金成;张世栋;史玉良;李庆忠;;基于Chunk Folding的多租户数据库缓存管理机制[J];计算机学报;2011年12期
4 汪德帅;张一川;张斌;刘莹;;面向多租约SaaS应用的负载均衡机制研究与实现[J];小型微型计算机系统;2012年01期
本文编号:555812
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/555812.html