大规模语义数据存储和查询技术研究
[Abstract]:At present, semantic World wide Web is widely used in many fields, such as medicine, biology, geographic information service and so on. However, with the advent of big data era and the continuous expansion of application system scale, semantic data is growing at an astonishing rate. The traditional semantic data storage management technology and system based on relational database can no longer effectively store and manage the large-scale rapid growth of semantic data. At the same time, the traditional serialized semantic query technology is difficult to adapt to large-scale semantic data query processing. In this context, solving large-scale semantic data storage and query by parallel computing technology has become a hot research issue in academia and industry. However, the parallel computing technology is closely related to the application problem, and the application problem itself has different complexity and diversity, which makes the processing of large-scale semantic data have great technical challenges and needs to be stored. Inquiry and other aspects of in-depth discussion and research. In order to solve the above problems, based on the analysis of resource description framework RDF (Resource Description Framework) and RDF data query language SPARQL (Simple Protocol and RDF Query Language), this paper uses the semantic data processing framework based on industrial standard OpenRDF Sesame. In this paper, a large-scale distributed semantic data storage and query technique based on HBase and Redis is proposed. In this method, the hybrid index is used to construct a hierarchical storage architecture to improve the performance of semantic data query. On this basis, this paper further analyzes the processing process of SPAROL query engine, and optimizes the join query of the query model by constructing the cost model. Using the query intermediate result set to optimize the query execution strategy to ensure the high efficiency of semantic data query; In order to improve the reliability and availability of query engine, this paper also studies and discusses the fault tolerance and extensibility design of large-scale semantic data storage management and query engine. Finally, based on the storage architecture and query optimization scheme, a large-scale semantic data storage and query prototype system is designed and implemented in this paper. The experimental results show that the proposed approach to large-scale semantic data storage and query is effective. The research work of this paper is mainly divided into the following two parts: the first part: the research of the existing semantic data storage technology, the design of large-scale semantic data storage model, Based on the storage model, a hybrid index storage method and hierarchical storage architecture are proposed, and the fault tolerance and scalability solutions of the storage architecture are proposed. In the second part, the execution flow of semantic data query engine is analyzed. In the aspect of query model optimization, this paper proposes a join operation optimization algorithm based on selection degree estimation. In the aspect of query strategy optimization, this paper proposes an adaptive batch query scheme.
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP311.13;TP333
【相似文献】
相关期刊论文 前10条
1 冯升华,黄利平,方剑,李建明;多企业联合查询技术的研究与实现[J];清华大学学报(自然科学版);2001年08期
2 伊莉娜;王培东;;基于“智能克隆”的移动查询技术[J];哈尔滨理工大学学报;2008年06期
3 朱蓉;基于模糊理论的查询技术研究[J];计算机应用研究;2003年05期
4 廖湖声,郑玉明;多源空间数据库查询技术[J];北京工业大学学报;2004年02期
5 黄希琛;无编码通用词库的高倍逻辑压缩和反向查询技术原理[J];中文信息学报;1994年02期
6 石静;刘永山;;基于开放区域的定量方向关系查询技术[J];计算机工程;2007年22期
7 王国华;;计算机图形信息的查询技术研究与实现[J];长沙航空职业技术学院学报;2006年01期
8 熊剑平,贾惠波,王洪;电子档案的因特网查询技术[J];缩微技术;1997年04期
9 李增祥;;数据库SQL查询技术的优化策略[J];消费导刊;2009年10期
10 许龙飞;;数据库自然语言查询技术研究[J];计算机科学;1997年05期
相关会议论文 前7条
1 李永光;王镝;王国仁;马宜菲;;基于块排序索引的生物序列局部比对查询技术(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
2 魏华;;Delphi应用程序中查询技术的实现[A];图像 仿真 信息技术——第二届联合学术会议论文集[C];2002年
3 任咏林;秦勉;任伟林;于重重;;基于XML的查询技术[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
4 张昱;吴年;;XML数据流的过滤与查询技术[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 胡皓;罗景青;;基于模糊理论的查询技术研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
6 王佳;杨树强;贾焰;;面向海量数据的并行UNION查询技术研究与实现[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年
7 张梅;;PB7.0通用任意字段查询技术的实现[A];贵州省自然科学优秀学术论文集[C];2005年
相关博士学位论文 前2条
1 黄玉龙;基于GPU的查询技术并行化研究[D];华南理工大学;2013年
2 李先通;图数据查询技术的研究[D];哈尔滨工业大学;2009年
相关硕士学位论文 前10条
1 张建;大规模语义数据存储和查询技术研究[D];南京大学;2014年
2 石静;基于开放区域的方向关系查询技术研究[D];燕山大学;2006年
3 唐兵兵;达梦数据仓库中多维查询技术的研究[D];华中科技大学;2009年
4 曾锃;基于一阶谓词逻辑的代码查询技术[D];南京大学;2011年
5 李华强;本体存储与查询技术研究[D];北京邮电大学;2007年
6 李军;XML文档查询技术研究及在数字图书馆中的应用[D];湖南师范大学;2009年
7 岳友友;XML查询技术研究[D];重庆大学;2006年
8 黄峗炜;RDF-XML文档的索引查询技术研究与实现[D];解放军信息工程大学;2007年
9 伊莉娜;基于Agent的移动查询技术研究[D];哈尔滨理工大学;2008年
10 任俊国;多数据源可控查询技术的研究与应用[D];山东科技大学;2011年
,本文编号:2471720
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2471720.html