RDF数据在线更新处理系统研究
本文关键词:RDF数据在线更新处理系统研究
【摘要】:由于具有灵活方便的特点,RDF(Resource Description Framework)在多个领域中得到普遍应用,其数据量也在飞速增加。正是由于RDF数据在变化,许多应用都需要对RDF数据进行灵活的更新。为此,RDF数据查询语句SPARQL(SPARQLProtocol and RDF Query Language)也增加了数据更新的内容,RDF存储系统理应支持。现有RDF存储系统的研究工作多集中于存储的优化和查询性能的提升,而在数据更新方面的研究较少。 RDF在线更新处理系统x-TripleBit旨在提供高效的处理大规模RDF数据更新的方法。为了提高事务处理的速度,系统提出了一种以数据块为单位的细粒度事务执行框架,每个SPARQL语句都被分解成针对各个数据块的子任务,,由于数据块之间的数据互不重叠,因此同一个SPARQL语句的各个子任务可以并行执行,加速了事务处理。在此基础上系统采用了一种两层事务调度方案优化事务执行过程,该调度方案分别在数据块层面和数据块内部进行事务调度,减少读写数据的次数以提高系统的并行度。在处理数据块中新增数据的插入时系统采用了延迟更新的策略,利用二级缓存提高系统的性能。而对于RDF数据的批量更新,系统针对RDF数据的特点和系统的存储结构提出了一个两步更新的策略,新增数据首先在缓存中进行处理,然后再将缓存中的数据合并到数据库中。 x-TripleBit与目前较好的RDF数据存储系统TripleBit、RDF-3X相比:查询性能方面,在处理不是特别简单的查询语句时,比TripleBit提升了30%左右;数据批量更新方面比RDF-3X提升了接近40%;数据在线更新方面在高负载的情况下相比RDF-3X、PostgreSQL有数十倍的性能提升。
【关键词】:批量更新 在线更新 事务处理 事务调度
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP333
【目录】:
- 摘要4-5
- Abstract5-8
- 1 绪论8-15
- 1.1 研究背景和问题提出8-9
- 1.2 国内外研究现状9-13
- 1.3 研究内容13-14
- 1.4 文章框架结构14-15
- 2 RDF 在线更新处理系统设计15-21
- 2.1 X-TRIPLEBIT 主要设计思想15-16
- 2.2 X-TRIPLEBIT 系统结构与系统模块16-18
- 2.3 X-TRIPLEBIT 工作流程18-20
- 2.4 本章小结20-21
- 3 细粒度的 SPARQL 事务并行处理技术21-34
- 3.1 概述21-22
- 3.2 SPARQL 查询语言简介及解析22-25
- 3.3 以块为单位的细粒度事务执行框架25-26
- 3.4 两层事务处理调度方法26-29
- 3.5 SPARQL 事务处理的实现29-33
- 3.6 本章小结33-34
- 4 数据更新的执行和优化34-40
- 4.1 RDF 数据的批量更新34-35
- 4.2 RDF 数据的在线更新35-39
- 4.3 本章小结39-40
- 5 系统测试与分析40-49
- 5.1 测试环境40
- 5.2 测试数据集40-41
- 5.3 性能测试41-47
- 5.4 本章小结47-49
- 6 总结与展望49-51
- 致谢51-53
- 参考文献53-57
- 附录 1 攻读学位期间申请的软件著作版权57-58
- 附录 2 攻读学位期间参与的主要科研项目58-59
- 附录 3 LUBM 数据集的查询语句59-60
- 附录 4 UNIPROT 数据集的查询语句60-61
- 附录 5 BTC 数据集的查询语句61
【相似文献】
中国期刊全文数据库 前10条
1 王志军;;应用程序也能批量更新[J];电脑迷;2007年10期
2 李辉;吴跃;龚海刚;;基于队列模型的批量更新密钥的研究[J];计算机应用;2009年04期
3 李辉;;基于秘密份额的组密钥批量更新方案的研究[J];福建电脑;2013年03期
4 刘兵;林剑;李艳华;徐磊;;一种GridView批量更新方法[J];电脑编程技巧与维护;2011年18期
5 欧阳艳阶;张明;;GridView控件批量更新方法的改进研究与实现[J];十堰职业技术学院学报;2013年02期
6 张迎新;;批量更新,Office 2003也可以[J];电脑爱好者;2006年23期
7 张率;;为Office 2003来个批量更新[J];办公自动化;2007年02期
8 周本新,安兴亚,童小念;ASP.net中自动生成批量更新数据表单的设计[J];中南民族大学学报(自然科学版);2004年04期
9 沈明峰;巧用Javascript实现网站批量更新[J];电脑爱好者;2003年01期
10 谢海涛;王玉明;杨宗凯;程文青;;一种M维几何球形组播密钥批量更新方案[J];小型微型计算机系统;2010年02期
中国硕士学位论文全文数据库 前3条
1 翁海星;面向读写分离、批量更新存储机制的高效分布式索引[D];华东师范大学;2016年
2 范立健;RDF数据在线更新处理系统研究[D];华中科技大学;2014年
3 王s
本文编号:932695
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/932695.html