当前位置:主页 > 科技论文 > 计算机论文 >

XML数据的查询技术及优化策略

发布时间:2015-02-11 16:16

摘 要:

摘 要:随着科学技术的发展,计算机为主的一系列科学技术得到了迅猛发展,XML,可扩展标记语言,也成为网络应用中重要的组成部门。XML广泛应用于金融、电子政务、电子商务、科学数据、出版、以及各种资料的数字化管理,成为数据交换的标准。IBM公司直接就把XML作为产品的新卖点,微软也称能够实现XML的查询和存储。XML数据管理市场竞争激烈,引发了XML技术的不断改革和提高。

关键词:

关键词:XML 数据查询 优化策略

XML具有高性能的数据查询和存储功能,能够实现计算机的广泛存储。XML在金融领域的广泛引用,引起了各个软件公司进行XML技术的研发和改革。IBM公司、微软公司、Oracle公司都在致力于XML技术的优化。用户可以用结构化查询语言和关键字查询在XML获取相应的信息。


1 XML数据查询方法

1.1 关系存储基础

为了达到查询XML数据的目的,多种查询语言已经被研发出来,比如XQUERY、QUIT、XML-QL、XPATCH等,查询语言有一个共同的特点,使用正则路径表达式引导XML查询,这种方法便于分析、合成、抽取文档的主要内容。存储结构和查询性能和存储方式有密切的关系,一般采用四种存储方式进行选择。这四种是特殊数据库系统、关系数据库系统、对象数据库系统以及文件系统。从查询的意义上说,关系数据库系统最为方便。采用关系数据库系统之前,要生成一个关系模式,等效于XML的文档。有了关系模式以后,XML文档就是按照这种关系模式进行存储的,然后才能进行查询工作。

XML文档用关系数据库系统进行查询也有很多的不足之处,主要有在进行查询之前,XML要将XQUERY转化成为SQL进行数据的查询。但是在实际操作中,很多的XML不能成功进行转化,导致XML查询功能存在缺陷。

1.2 使用索引功能

依据XML独有的特点,很多时候都是使用路径表达式作为查询语言。使用索引功能也是查询中常见的方法,,路径索引能够有效的提高查询效率。常见的有效路径索引结构是DATA  GUIDE,这种路径索引主要是提高了数据的访问效率,适用于数据存在引用关系或者源数据环数很多或者完全引用的时候。

路径索引对象的数量很大,在操作过程中太过于复杂。为了减轻维护和建立路径索引所要付出的代价,可以使用更新路径索引和分布建立的方案,这样能够有效减少路径索引的复杂程度。

1.3 使用DOM树

与DOM进行交互作用是XML的真正优势。DOM是指文档对象模型,是数据机制的界面。在实际中XML组织结构采用的层层嵌套的模式,采用DOM树以后,XML会产生一个根结点,这个节点表示的XML文档。每个结点的后面跟随几个元素,这些元素就是树的分支,元素后面还有其他的元素,就是树的分支后面还有其他分支,这样就变成了一个XML文档树。DOM树就是通过随机访问XML文档,在DOM树的随意位置建立附加的结点,这种方式优势明显。


2 XML查询方法分类

2.1 NXD查询

NXD查询是指将XML编辑一个逻辑模型,利用这个模型进行 XML文档的检索和存储,这种查询方法的优点是不用独特的底层物理存储模型,因为它是建立在面向对象、层次、关系之上的。

不一样的 NXD体系也是不同的,主要是采纳了成熟的数据库管理系统,然后加上XML的结构特点,形成了不同的存储形式。典型的体系结构采用数据分析模块作为数据的输入,不同的概念数据分析XML数据,接受解析树以后,转化为内部模型。查询输出、查询求解、查询优化、查询解析是主要的查询语言的过程,通过优化代数系统得到结构的查询。

2.2 DOM树查询数据

DOM树定义文档逻辑结构,能够将数据信息进行层次管理,结点对应着功能和行为,组成一个整体。DOM能够为结点的访问提供访问接口,这些访问接口用来动态操作XML的风格、结构、内容,还可以删除要素和内容、修改、查询、添加、结构等操作。

DOM对象能够对XML文件进行操作,然后使用DOM对象建立DOM树,这样可以转换成为文件,进行操作。对XML文件进行操作得到文件信息,然后对结构树的属性和元素实施操作。

DOM的最大优点就是编写程序方便,DOM先是对文档进行分析,使文件变成独立的注释、属性和元素。节点代表着XML文档,程序能够随时随意的进行访问任意的节点信息和修改节点。这种方式使得程序能够在很抽象、很高的层次上工作,减少了底层的工作量,极大的提高了查询工作效率。

2.3 TWIG 查询

TWIG查询求解主要是以下步骤:第一,将TWIG分为二元的结构,如祖先——子孙,父亲——孩子;第二,使用结构连接算法,搜索数据库查找满足条件的节点;第三,合并得到了结果,得出最后的结构关系结果。此外,还可以在结构连接中吸收XML信息和新的连接算法提高结构连接操作,增大分解粒度。


3 关键字查询系统

3.1 查询接口

现在的查询接口主要是分为2类:一类是纯文本输入;另一种是指定属性值和属性查询方式。

3.2 工作机制

查询处理器负责生成查询、执行查询和展示结果,存储管理器管理模式信息、索引、数据,并且对数据库的数据进行缓冲管理。

主要的操作步骤是:第一,用户键入关键字,清洗功能首先进行容错处理,剔除没用的关键字,识别有意义的短语,并且依据历史上其他用户的查询过程进行推荐,为用户提供更加具有意义的关键字查询;第二,搜索引擎执行算法,按照排序机制和查询语句执行,执行以后,使用存储管理器取得符合条件的查询结果;第三,满足条件的语义将会按照用户查询的主次程度,进行先后顺序的展示。

3.3 关键技术

XML查询主要有五个方面的重点问题,首先是查询生成,能够向搜索引擎尽快的提交相关的查询关键字,并且表达用户自身的愿望的代表。然后是查询语义,搜索引擎能够自动的剔除没用的关键字,更加确定中心的关键字,这样能够有效的集中展示更加符合用户要求的查询结果。其次,查询到的结果还会依据客户的关注程度进行排序,和用户想要搜索的信息最相关的排列在最上面,依次按照相关程度向下排列,最不相关的排在最后。并且,高效算法能够有效的提高系统的查询速度和系统的反应速度,以最快的方式查出结果。最后,查到的结果还要进行某种方式传达给用户,用户能够清晰的看到相关内容,并且还能看见与关键字有联系的内容,提高了用户选择度。


4 XML系统优化

自从XML问世以后,XML系统的研究就没有中断过,很多公司都在积极地进行XML系统的研发,极大的优化了XML系统的查询技术。但是现在XML系统仍然存在很多的问题,我们现在所应用的技术看来,高效性和有效性是XML查询系统的重点目标。有效性是指用户输入了相关关键字以后,系统能够自动的分辨输入的信息排除没用的关键字,对主要的关键字进行查询,减轻了系统工作量;返回结果包括关键字的关系,用户能够理解返回结果所要表达的信息;系统提高智能化,能够依据用户输入的关键字揣测出来作者的目的,进行针对性的查询,查询结果尽可能满足用户的意图;若是查询的结果出现了偏差,系统能够及时进行改进,对于不符合要求的内容自动删除,重新进行快速搜索,再次呈现用户的查询目的。


5 总结

虽然XML关键字查询系统已经得到了广泛的应用,为金融、电子商务等带来了巨大的便利,但是XML系统仍然存在很多技术上的问题,需要科技人员不断的进行研发,完善XML系统,争取让该系统工作效率更加高效,查询结果更加满足用户的需要。



本文编号:14593

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/14593.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c7749***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com