当前位置:主页 > 科技论文 > 搜索引擎论文 >

XML数据库目录结构研究

发布时间:2019-05-12 09:34
【摘要】:作为SOA架构的基石,XML随着计算机网络和应用程序配置迅猛发展在数据存储交换领域越来越广泛,致使它成为事实上的数据交换标准,XML技术注定会有光明的未来。在当今的互联网世界中,XML格式的数据量随着XML技术日益广泛的应用而以指数级别增长,出现在我们面前这样一个问题,那就是XML数据存储管理问题。所以,在现实应用中,如何高效地管理和存储XML文档数据成为亟待解决的现实问题。XML数据存储和管理领域研究的重要内容之一是查询处理,而XML数据库技术的关键是如何对XML数据建立合适的索引。 本文对XML数据索引策略及特点做出了详细阐述,以深层次研究有关XML数据存储管理方法为基础,,并且紧密联系搜索引擎技术在互联网中有效展示技术特点等因素,提出将结构目录索引与全文索引相结合的联合索引技术,这种技术是对搜索引擎中倒排索引技术和结构查询相结合的方法的改进。其中,提出了适合于基于B+树建立索引的编码机制,XML数据节点经过特殊编码处理后使用B+树来为其建立结构索引。本文改进和创新了XML文档树中的节点编码,查询处理和索引结构等,将XML数据在结构查询和基于关键词的全文检索方面的效率均提高了。
[Abstract]:As the cornerstone of SOA architecture, XML is becoming more and more extensive in the field of data storage exchange with the rapid development of computer network and application configuration, which makes it become the de facto data exchange standard. XML technology is bound to have a bright future. In today's Internet world, the amount of data in XML format increases with the increasing application of XML technology at the exponential level, which appears in front of us, that is, the problem of XML data storage management. Therefore, in practical applications, how to manage and store XML document data efficiently has become a practical problem to be solved urgently. One of the important contents in the field of XML data storage and management is query processing. And the key of XML database technology is how to establish an appropriate index of XML data. In this paper, the strategy and characteristics of XML data index are described in detail, based on the deep research on the methods of XML data storage management, and closely related to the effective display of technical characteristics of search engine technology in the Internet. A joint index technology combining structural catalog index with full-text index is proposed, which is an improvement of the combination of inverted index technology and structural query in search engine. Among them, a coding mechanism is proposed, which is suitable for index building based on B tree. XML data nodes use B tree to establish structural index after special coding processing. In this paper, the node coding, query processing and index structure in XML document tree are improved and innovated, and the efficiency of XML data in structural query and keyword-based full-text retrieval is improved.
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 赵威;;XML代数查询优化研究[J];黑龙江科技信息;2008年01期

2 胡少伟;;XML路径表达式的查询优化技术[J];科学之友(B版);2009年08期

3 赵威;闫飞;;XML文件树状路径查询优化研究[J];计算机与信息技术;2007年12期

4 朱华兴;周丽娟;周梦熊;;XML数据查询的并行算法[J];自动化技术与应用;2007年01期

5 李熙;徐德智;;基于模式的XML查询重写研究[J];中国科技信息;2009年12期

6 郭晓磊;赵利;聂铁铮;;支持全文检索的XQuery查询处理及优化的研究[J];计算机与数字工程;2010年08期

7 李元韬;曹志宇;;XML查询语言XQuery的分析与研究[J];太原科技;2010年01期

8 张艳华;;XML文档在关系数据库中存储与查询的实现[J];中国科技信息;2010年19期

9 陈继明;鞠时光;潘金贵;;基于正则路径表达式的XML查询优化技术研究[J];计算机科学;2007年02期

10 张博;耿志华;周傲英;;一种支持高效XML路径查询的自适应结构索引[J];软件学报;2009年07期

相关会议论文 前10条

1 吕建华;王国仁;于戈;;XML数据的存储、索引和查询优化技术及其性能评价[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

2 张蕊;高晓东;宫学庆;周傲英;;XML数据流上的树型查询处理[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

3 黄宇凯;王晓玲;周傲英;;LEO:基于序列化的XML文档高效查询处理方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

4 李慧婷;李建中;王宏志;骆吉洲;;XML数据磁盘存储结构LDF&B及其查询处理方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

5 ;基于DTD的XML路径表达式查询优化(英文)[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

6 王宏志;李建中;骆吉洲;何振瀛;;基于路径压缩XML数据上的twig查询处理[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

7 周军锋;孟小峰;张新;黄静;;XML数据流上基于关键字的多查询处理[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

8 和菊珍;彭敦陆;王晓玲;周傲英;;优化分布式环境中的多个XML查询[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

9 丁灵;黄宇凯;王晓玲;胡大斌;周傲英;;基于序列化方法实现有效的无序XML查询[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

10 王静;孟小峰;王珊;;以目标节点为导向的XML路径查询处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

相关重要报纸文章 前10条

1 秦林;《XML完全探索》[N];中华读书报;2001年

2 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年

3 ;分化并不能阻止XML发展[N];中国计算机报;2000年

4 ;为XML标准定标准[N];中国计算机报;2001年

5 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年

6 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年

7 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年

8 奎儒;国际邮件查询处理问答[N];中国邮政报;2002年

9 奎儒;国际邮件查询处理问答[N];中国邮政报;2002年

10 常丽君;欧盟建首个危险化学药品数据库[N];科技日报;2010年

相关博士学位论文 前10条

1 胡文生;XML数据流上基于窗口的查询处理方法研究[D];武汉大学;2012年

2 江锦华;XML小枝模式查询处理技术研究[D];浙江大学;2009年

3 刘喜平;XML文档搜索中的查询处理技术研究[D];江西财经大学;2010年

4 张万松;支持压缩域查询的XML数据压缩方法研究[D];哈尔滨工程大学;2005年

5 李瑞轩;异构信息集成中的查询处理与优化研究[D];华中科技大学;2004年

6 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年

7 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年

8 王洪强;XML索引及查询处理技术研究[D];哈尔滨工业大学;2009年

9 张博;基于XML索引和缓存的查询优化[D];复旦大学;2008年

10 邵峰;XML数据管理中的结构查询技术研究[D];浙江大学;2008年

相关硕士学位论文 前10条

1 王侠;XML数据库目录结构研究[D];吉林大学;2013年

2 胡鑫;基于关系数据库的XML查询优化技术研究[D];西北师范大学;2006年

3 陈继明;基于正则路径表达式的XML查询优化技术的研究与实现[D];江苏大学;2005年

4 詹欣;基于实体化视图的XML查询处理方法的研究[D];哈尔滨工业大学;2006年

5 王a\;基于PAT代数的XML数据查询优化方法研究[D];兰州理工大学;2011年

6 赵一雪;基于XML数据库的数据查询优化的研究[D];哈尔滨工程大学;2006年

7 赵九震;XML数据查询的关键技术研究[D];山东大学;2010年

8 石小艳;分布式数据库查询优化机制研究[D];中国石油大学;2007年

9 王小燕;传感器网络数据管理系统查询机制的研究与实现[D];南京航空航天大学;2007年

10 袁冬莉;基于异构数据库集成技术的医院管理系统研究[D];重庆大学;2007年



本文编号:2475283

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2475283.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b66a4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com