基于UB树的大型稀疏矩阵存储研究
本文选题:稀疏矩阵存储 + UB树 ; 参考:《云南大学》2013年硕士论文
【摘要】:稀疏矩阵的应用领域广泛,典型的如网络分析、图论、解微分方程、社会关系分析、线性规划等领域。传统用于存储大型稀疏矩阵的通用存储结构主要有两种——行压缩存储格式CRS (Compressed Row Storage)和列压缩存储格式CCS (Compressed Column Storage)。CRS和CCS均有效实现了数据的压缩存储,其中行压缩存储是按整行来存储非零元素,行压缩存储使用行索引来实现对行的查询;列压缩存储是按整列来存储非零元素,且列压缩存储使用列索引来对列的元素查询。 本文从多维数据角度重新审视稀疏矩阵大数据存储,提出了基于UB树的稀疏矩阵存储结构。本文主要工作点主要包括: ①稀疏矩阵的UB树存储机制研究,包括稀疏矩阵的Z-order降维,B+树分裂与Z-region演化过程研究。 ②提出基于UB树的稀疏矩阵的查询算法与各类运算算法。查询算法主要实现矩阵的非零元素查询,矩阵运算算法本文只是做了简单实现,分别有矩阵加法运算、乘法运算、转置运算。 ③对UB树范围查询算法进行了改进。本文在研究范围查询算法时针对UB树范围查询算法的某处的性能瓶颈,提出了一种新的范围查询算法。 ④最后与行压缩存储进行了比较测试,测试内容有存储性能、元素查询性能、子矩阵查询性能以及改进后的范围查询算法与原算法的性能比较。
[Abstract]:The sparse matrix has wide application fields , such as network analysis , graph theory , differential equation , social relation analysis , linear programming and so on . The conventional general storage structure used to store large sparse matrix mainly includes two _ row compressed storage format CRS ( Compressed Row Storage ) and column compressed storage format CCS ( Compressed Column Storage ) . CRS and CCS effectively implement the compressed storage of the data , wherein the row compression storage is to store non - zero elements according to the whole row , and the row compression storage uses the row index to realize the query of the row ;
Column compression stores are columns that store non - zero elements , and column compression stores column indexes to query columns of elements .
In this paper , a sparse matrix storage structure based on UB tree is proposed from the viewpoint of multi - dimensional data . The main work points of this paper are as follows :
( 1 ) The research on UB tree storage mechanism of sparse matrix , including Z - order dimension reduction , B + tree splitting and Z - region evolution of sparse matrix .
In this paper , a query algorithm of sparse matrix based on UB tree and various algorithms are proposed . The query algorithm mainly implements non - zero element query of matrix , and the matrix operation algorithm is simply implemented .
In this paper , a new range query algorithm is proposed for the performance bottleneck of UB tree range query algorithm .
( 4 ) Finally , the comparison test is carried out with the line compression storage , and the test content has storage performance , element query performance , sub - matrix query performance and improved range query algorithm compared with the performance of the original algorithm .
【学位授予单位】:云南大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP333
【共引文献】
相关期刊论文 前10条
1 ;THREE DIMENSIONAL DATA STRUCTURE AND DATA MODEL[J];Geo-Spatial Information Science;2000年03期
2 周宁;丁琦;;开放实时数据库及其在调度自动化系统中的应用[J];电网技术;2006年S2期
3 罗心,乐晓波;延缓B-树生成过程中结点分裂的算法[J];湖南教育学院学报;2000年02期
4 张斐;;一种国外预测网络社区发展趋势的新方法[J];才智;2013年06期
5 江克勤;吴海峰;程玉胜;;《数据结构》中B-树的删除算法的实现[J];电脑知识与技术;2014年16期
6 陈德智;姜贺;张哲;潘瑞敏;;有限元法的一种数据结构[J];电工技术学报;2015年01期
7 徐国定;;查询语句语义优化的一个方法[J];华东师范大学学报(自然科学版);1987年02期
8 ;第四章 索引结构[J];计算机工程与应用;1981年Z2期
9 David B.Lomet;顾君忠;;数字B树[J];计算机科学;1984年01期
10 周鹏;杨丹;鱼详训;;带快照的混合数据库系统设计与应用[J];计算机科学;2008年04期
相关会议论文 前2条
1 周宁;丁琦;;开放实时数据库及其在调度自动化系统中的应用[A];2006电力系统自动化学术交流研讨大会论文集[C];2006年
2 马文骞;王珊;;DBMS进程结构研究及多线索DBMS的设计与实现[A];第十一届全国数据库学术会议论文集[C];1993年
相关博士学位论文 前10条
1 许浒;时空数据库聚集查询算法研究[D];华中科技大学;2010年
2 徐红波;基于空间填充曲线高维空间查询算法研究[D];哈尔滨理工大学;2010年
3 罗德安;一种基于关系数据库的空间数据模型及其特殊应用[D];西南交通大学;2001年
4 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
5 朱铁稳;基于均匀空间离散域对象的空间数据库关键技术研究[D];中国人民解放军国防科学技术大学;2002年
6 杨峰;分布式并行索引研究[D];电子科技大学;2003年
7 董云卫;工作流管理系统的事务建模研究[D];西北大学;2004年
8 袁贞明;基于样例的空间数据检索技术研究[D];浙江大学;2005年
9 崔江涛;高维索引技术中向量近似方法研究[D];西安电子科技大学;2005年
10 刘小虎;安全组播中的组密钥管理算法研究[D];中国科学技术大学;2006年
相关硕士学位论文 前10条
1 程晓;数据仓库中基于位图索引查询优化的研究[D];郑州大学;2010年
2 路瑞强;基于均值和标准差的空间索引方法研究[D];哈尔滨工程大学;2010年
3 马伟;基于FD-tree的闪存数据库索引技术研究[D];浙江大学;2011年
4 杨玉军;时态索引技术及算法的研究[D];中南林业科技大学;2007年
5 谭长德;南岳衡山景区网络地理信息系统的研究与设计[D];电子科技大学;2010年
6 冯知一;基于数据仓库的联机分析处理系统关键技术研究与实现[D];西安电子科技大学;2009年
7 吴家盛;支持无线传感器网络的实时数据库存储管理[D];华中科技大学;2010年
8 程阳;关系数据库管理系统的一种简易的数据存储与查询模块的设计与实现[D];华中科技大学;2010年
9 翟建东;闪存碎片影响分析与闪存数据库索引技术研究[D];华中科技大学;2011年
10 杨蓝麒;一种智能手机上基于位置的多媒体信息分享系统[D];上海交通大学;2012年
,本文编号:1883384
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1883384.html