当前位置:主页 > 科技论文 > 软件论文 >

HBase数据库的安全索引研究

发布时间:2019-03-15 09:26
【摘要】:大数据时代的到来,传统关系型数据库在存取速率等方面越来越无法满足海量数据处理的需求,NoSQL数据库应运而生。与关系型数据库相比,NoSQL数据库在安全方面存在不足。HBase分布式数据库是一种安全机制比较完善的NoSQL数据库,但HBase数据库中的数据文件却是以明文形式存储的,这便形成一定的安全漏洞。为HBase数据库中的数据文件进行加密处理,并为HBase数据库构建密文安全二级索引,使得HBase密文数据库具有条件查询能力是非常具有意义的。根据HBase分布式数据库中列数据的数据类型的不同可以分别研究数值型密文检索和文本型密文检索。对于HBase分布式数据库中数值型数据的密文检索,提出一种基于改进型安全R树的检索策略。在为HBase的数据表的数据构建R树安全索引时,会利用R树的动态特性根据数据表构建索引需要的列值来将RowKey行按照设定的加密策略存入到索引表的恰当位置。同时采用将HBase的数据表DataTable相对应的索引表IndexTable存入HBase中来确保对索引表使用与维护。这种方式能够很好的支持针对列的等值检索与范围检索。对于HBase分布式数据库中文本型数据的密文检索,提出一种基于安全倒排索引的检索策略。在构建文本型密文索引时,将HBase的常用于构建二级索引的coprocessor框架与开源搜索引擎工具包Lucene进行有机结合,将HBase中Column Family/Q ualifer限定的列规范为文本内容之后进行分词加密,同时采用将Lucene中的相关文件等信息保存在HBase数据库中来保证数据的完整性和可用性。这种方式可以很好地支持针对列的等值查询与子串查询。设计实现了基于HBase的密文检索原型系统,实现了用户管理模块、加解密模块、密钥管理模块、密文索引生成与检索模块等,并对系统进行了实验测试。HBase安全索引充分利用了现有HBase快速检索能力,目前的研究成果对密文数据查询多样性的支持仍有一定的局限,该方向仍具有极大的研究空间与研究意义。
[Abstract]:With the arrival of big data era, the traditional relational database can not meet the needs of massive data processing in terms of access rate and so on. Therefore, NoSQL database emerges as the times require. Compared with relational database, NoSQL database has shortcomings in security. HBASE distributed database is a kind of NoSQL database with perfect security mechanism, but the data files in HBase database are stored in plain text. This forms a certain security loophole. It is very meaningful to encrypt the data files in HBase database and construct the secure secondary index of ciphertext for HBase database, which makes the HBase ciphertext database have the ability of conditional query. According to the different data types of column data in HBase distributed database, numerical ciphertext retrieval and text ciphertext retrieval can be studied respectively. For encrypted text retrieval of numerical data in HBase distributed database, a search strategy based on improved secure R-tree is proposed. When constructing the R-tree secure index for the data of the data table of HBase, the dynamic characteristics of the R-tree are used to store the RowKey row in the proper location of the index table according to the set encryption policy, according to the column value needed to build the index of the data table. At the same time, the index table IndexTable corresponding to the data table DataTable of HBase is stored in HBase to ensure the use and maintenance of the index table. This method can well support the column equivalent retrieval and range retrieval. A secure inverted index-based retrieval strategy for Chinese text-based data retrieval in HBase distributed database is proposed in this paper. When constructing text-based ciphertext index, we combine the coprocessor framework of HBase, which is commonly used in building secondary index, and Lucene, an open source search engine toolkit, to encrypt word segmentation after standardizing the Column Family/Q ualifer-qualified column in HBase as text content. At the same time, the data integrity and availability are ensured by storing the relevant files in the Lucene database in the HBase database. This method can well support the equivalent query and substring query for columns. The prototype system of ciphertext retrieval based on HBase is designed and implemented, which includes user management module, encryption and decryption module, key management module, ciphertext index generation and retrieval module, and so on. The security index of HBASE makes full use of the existing fast retrieval ability of HBase, and the current research results still have some limitations on the support of the diversity of ciphertext data query, and the security index of HBASE has made full use of the fast retrieval ability of the existing HBASE. This direction still has great research space and significance.
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;TP309

【参考文献】

相关期刊论文 前10条

1 李文成;赵逢禹;;企业云存储数据的加密与密文全文检索研究[J];小型微型计算机系统;2013年02期

2 曹夕;许力;陈兰香;;云存储系统中数据完整性验证协议[J];计算机应用;2012年01期

3 邹燕飞;于成尊;赵亮;;基于Lucene的文本搜索引擎的设计和实现[J];计算机与现代化;2011年09期

4 卢冬海;何先波;;浅析NoSQL数据库[J];中国西部科技;2011年02期

5 郑榕增;林世平;;基于Lucene的中文倒排索引技术的研究[J];计算机技术与发展;2010年03期

6 田秀彦;李忠;罗士美;邓力强;;基于Struts+Hibernate+Spring的整合架构及其在Web开发中的应用[J];计算机与现代化;2008年11期

7 王静疆;;搜索引擎评价指标体系比较研究[J];图书情报工作;2008年10期

8 冯朝胜;秦志光;袁丁;;数据库加密系统密钥管理模块的设计[J];电子科技大学学报;2007年05期

9 胡立春;武友新;张烨;姜晓东;;LDAP环境下的统一用户管理系统的研究与实现[J];计算机工程与设计;2007年04期

10 管建和;甘剑峰;;基于Lucene全文检索引擎的应用研究与实现[J];计算机工程与设计;2007年02期

相关硕士学位论文 前6条

1 付文静;基于HBase的大数据存储查询技术研究[D];电子科技大学;2015年

2 蔡平;基于Hadoop的NoSQL数据库安全研究[D];上海交通大学;2013年

3 关尔昱;基于数据库外层加密的数据库加密系统的设计与实现[D];北京邮电大学;2010年

4 宋赛;密文全文检索系统的安全索引结构研究[D];华中科技大学;2009年

5 刘可;数据库加密系统研究[D];合肥工业大学;2006年

6 余登峰;基于R树的空间数据索引技术研究与实现[D];中国地质大学;2006年



本文编号:2440504

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2440504.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户daee2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com