基于Schema特征的Twig模式最小化研究
发布时间:2017-10-19 19:32
本文关键词:基于Schema特征的Twig模式最小化研究
更多相关文章: Twig XML Schema特征 Twig模式最小化
【摘要】:XML是一种半结构化的数据描述语言,因其具备高可读性、跨平台性和可扩展等特性,在互联网领域被广泛应用。为了推动XML数据查询和处理的标准化,国际万维网组织W3C发布了XQuery语言用于描述XML数据的查询。由于XML数据具有的半结构化特性,因此对XML数据的查询相对复杂。所以,查询的优化技术引起众多学者的关注。Twig模式查询,又称为树模式查询,是XQuery的核心操作。由于Twig查询中往往存在一些多余的子查询,即查询请求本身具有冗余性。通过剪裁这些冗余分支和节点的方式,可以减小查询的计算量,提高查询的效率。XML Schema定义了XML文档中的数据类型,通过分析XML Schema,提取元素之间的结构约束关系,即Schema特征关系。参照Schema特征关系可以确定Twig模式中的冗余节点,删除冗余节点的过程即Twig模式最小化。本文将Schema特征关系扩展为必然孩子、必然父亲等基本特征关系和路径必然孩子、路径必然父亲等扩展特征关系,为Twig模式最小化提供更多机会。基于XML Schema文档设计Schema特征提取算法,用于判断Schema文档是否满足给定标签名节点间的特征关系。当Twig模式中的节点满足相应的特征关系时,才能对其进行优化,这些条件归纳成优化规则。本文将针对Twig模式中的两种节点类型(查询节点和逻辑节点)以及两种节点位置(中间节点和叶子节点)设计优化规则。本文设计并提出一种基于Schema特征的Twig模式最小化算法。算法根据当前Twig模式中待优化节点的类型和位置,选择相应的优化规则。调用Schema特征提取算法,判断规则中条件是否成立,随后进行优化操作。最后,针对算法设计了测试案例,实验结果证明算法的有效性,且算法提高了查询效率,并根据测试结果分析得出了影响Twig模式最小化算法的因素。
【关键词】:Twig XML Schema特征 Twig模式最小化
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要4-5
- Abstract5-9
- 第1章 绪论9-17
- 1.1 课题背景9-10
- 1.2 相关研究10-12
- 1.2.1 Twig模式的研究现状10-11
- 1.2.2 Twig模式最小化的研究现状11-12
- 1.3 本文研究意义12-13
- 1.4 本文研究工作和主要贡献13-14
- 1.5 课题来源14
- 1.6 本文组织构成14-17
- 第2章 XML Schema特征17-23
- 2.1 XML Schema17-18
- 2.2 XML Schema特征18-20
- 2.2.1 基本特征关系18-19
- 2.2.2 扩展特征关系19-20
- 2.3 其他结构约束关系20-21
- 2.4 本章小结21-23
- 第3章 Twig模式优化规则23-31
- 3.1 Twig模式优化算法23
- 3.2 查询节点优化规则23-27
- 3.3 逻辑节点优化规则27-29
- 3.4 本章小结29-31
- 第4章 Schema特征提取算法31-39
- 4.1 基本特征提取算法31-35
- 4.2 扩展特征提取算法35-37
- 4.3 本章小结37-39
- 第5章 Twig模式最小化算法39-47
- 5.1 最小化算法描述39-42
- 5.2 最小化算法举例及分析42-45
- 5.3 本章小结45-47
- 第6章 试验与分析47-53
- 6.1 实验分析47-50
- 6.1.1 算法有效性47-48
- 6.1.2 算法影响因素48-50
- 6.2 实验结果50-51
- 6.3 本章小结51-53
- 结论53-55
- 参考文献55-59
- 攻读硕士学位期间取得的研究成果59-61
- 致谢61
本文编号:1062917
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1062917.html