分布式事务分类与数据连接查询优化的智能算法研究
发布时间:2020-11-12 19:12
信息技术的快速发展和广泛应用,各类信息系统采集、存储和处理的数据量呈爆炸性增长,对服务器的数据存储、搜索和管理能力要求越来越高。分布式数据库系统具有高并发、高可用和易扩展的优点,得到高度关注和系统性研究,其相关技术已经应用于很多大型信息系统。分布式数据库系统设计和查询处理是分布式数据库系统的关键技术,本文针对分布式事务分类优化问题和数据连接查询优化问题,以提高分布式数据库系统的响应效率为目标,对现有技术展开研究并加以改进。在构建分布式事务分类模型时,分析了基于凝聚型层次聚类算法的事务分类策略的机理及其缺陷,提出了引入事务执行频次比例的概念,然后在凝聚型层次聚类算法中结合蚁群优化算法转移概率的思想,通过转移概率随机选择下一个聚类对象,并以此解决凝聚型层次聚类算法不能回退的问题。按照事务分类优化结果将数据片段部署到执行该事务的站点后,在构建多连接查询代价模型时,考虑到带宽较低的网络环境,利用半连接算法减少数据服务器节点间数据传输产生的通信代价。然后通过与其他优化算法的比较,在将遗传算法应用到分布式数据库系统多连接查询优化的过程中对遗传编码、种群初始化、选择、交叉和变异等操作分别进行优化。实验结果表明,改进后的算法降低了分布式数据库系统不同场地间事务的关联度,并且减少了查询所需时间,提高了系统的响应效率。
【学位单位】:华南理工大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP311.13
【部分图文】:
第一章 绪论的是探索依然在不断前进。由上海科技大学和华东师范大学联手打造的 C-POREL、武汉大学制作的 WDDBS 和 WOODDBS、由东北大学制作的 DMU/FO 系统都显示分布式数据库系统的成熟技术[7]。分布式数据库系统已成为信息处理学科的重要领域正在迅速发展。现阶段已经有了很多分布式数据库系统,如 SQL Server、MySsqlORACLE、Distributed INGRES 等,随着信息及计算机网络的高速发展,分布式数库系统的应用会更加引起人们的关注。1.2.3 分布式数据库系统的体系结构目前数据库系统体系结构基本都是基于客户端/服务器模式,客户端提供操作数的接口,服务器提供处理数据的功能。传统的客户端/服务器主要由以下三个部分组成应用处理器(AP)、数据处理器(DP)、通信处理器(CM),如图 1-1 所示:
5图 1-2 基于中间件的客户端/服务器体系结构(1) 客户请求队列:存放所有用户从应用处理器发出的请求并缓存相应的结果;(2) 负载平衡检测:查看数据库服务器当前的性能状态并对用户请求进行调度,从而缓解服务器之间的访问压力;(3) 数据处理:处理数据库返回的响应数据,并将数据按照一定的规范传送给应用处理器;(4) 数据库管理器:接收客户请求队列中的请求,并按照数据库查询指令调用驱动程序管理器;(5) 驱动程序管理器:调用数据库驱动程序连接数据库;
在分布式数据库系统中,所有用户的请求最后都会被转换成一系列对数据库进行存取操作的序列,最基本的操作包括读操作和写操作两种。数据库应用中若干个为了完成相同任务且逻辑相关的操作序列被定义为事务,事务是保证数据库正确性的基本逻辑单元。数据库事务具有四个特性,分别是原子性(atomicity)、一致性(consistency)、隔离性(isolation)和耐久性(durability)。(1) 原子性:事务包含的操作序列要么全部执行,要么全部撤销,不允许部分执行部分撤销的情况发生。(2) 一致性:事务执行的结果只能使数据库从一种一致性状态转变到另一种一致性状态,而不会停留在某种不一致的中间状态上,如图 2-1 所示。但如果某个事务在执行的过程中由于某些外界因素被强制中断,一部分操作序列可能已经对数据库产生了影响,从而导致数据库在事务执行后状态发生改变,此时为了保证数据的正确性,部分操作必须反做。
【参考文献】
本文编号:2881125
【学位单位】:华南理工大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP311.13
【部分图文】:
第一章 绪论的是探索依然在不断前进。由上海科技大学和华东师范大学联手打造的 C-POREL、武汉大学制作的 WDDBS 和 WOODDBS、由东北大学制作的 DMU/FO 系统都显示分布式数据库系统的成熟技术[7]。分布式数据库系统已成为信息处理学科的重要领域正在迅速发展。现阶段已经有了很多分布式数据库系统,如 SQL Server、MySsqlORACLE、Distributed INGRES 等,随着信息及计算机网络的高速发展,分布式数库系统的应用会更加引起人们的关注。1.2.3 分布式数据库系统的体系结构目前数据库系统体系结构基本都是基于客户端/服务器模式,客户端提供操作数的接口,服务器提供处理数据的功能。传统的客户端/服务器主要由以下三个部分组成应用处理器(AP)、数据处理器(DP)、通信处理器(CM),如图 1-1 所示:
5图 1-2 基于中间件的客户端/服务器体系结构(1) 客户请求队列:存放所有用户从应用处理器发出的请求并缓存相应的结果;(2) 负载平衡检测:查看数据库服务器当前的性能状态并对用户请求进行调度,从而缓解服务器之间的访问压力;(3) 数据处理:处理数据库返回的响应数据,并将数据按照一定的规范传送给应用处理器;(4) 数据库管理器:接收客户请求队列中的请求,并按照数据库查询指令调用驱动程序管理器;(5) 驱动程序管理器:调用数据库驱动程序连接数据库;
在分布式数据库系统中,所有用户的请求最后都会被转换成一系列对数据库进行存取操作的序列,最基本的操作包括读操作和写操作两种。数据库应用中若干个为了完成相同任务且逻辑相关的操作序列被定义为事务,事务是保证数据库正确性的基本逻辑单元。数据库事务具有四个特性,分别是原子性(atomicity)、一致性(consistency)、隔离性(isolation)和耐久性(durability)。(1) 原子性:事务包含的操作序列要么全部执行,要么全部撤销,不允许部分执行部分撤销的情况发生。(2) 一致性:事务执行的结果只能使数据库从一种一致性状态转变到另一种一致性状态,而不会停留在某种不一致的中间状态上,如图 2-1 所示。但如果某个事务在执行的过程中由于某些外界因素被强制中断,一部分操作序列可能已经对数据库产生了影响,从而导致数据库在事务执行后状态发生改变,此时为了保证数据的正确性,部分操作必须反做。
【参考文献】
相关期刊论文 前10条
1 崔峰峰;南振岐;;基于蚁群算法的分布式数据库查询优化方法[J];计算机时代;2014年05期
2 吴庆洪;张颖;马宗民;;蚁群算法综述[J];微计算机信息;2011年03期
3 李志伟;;基于贪婪策略的分布式数据库查询优化研究[J];计算机工程与设计;2010年17期
4 帅训波;马书南;周相广;龚安;;基于遗传算法的分布式数据库查询优化研究[J];小型微型计算机系统;2009年08期
5 杨卫莉;郭雷;许钟;肖谷初;赵天云;;基于区域生长和蚁群聚类的图像分割[J];计算机应用研究;2008年05期
6 孙吉贵;刘杰;赵连宇;;聚类算法研究[J];软件学报;2008年01期
7 王菲菲;郑刚;;基于多连接属性划分的分布式数据库查询优化算法[J];现代计算机(专业版);2007年11期
8 韩启龙;郝忠孝;;分布环境下实时数据的分配算法[J];计算机工程;2006年05期
9 杨艺,陈鹏,李相枢;一种广域网中分布式数据库设计的数据分配方法[J];计算机应用;2003年12期
10 杨欣斌,孙京诰,黄道;一种进化聚类学习新方法[J];计算机工程与应用;2003年15期
相关硕士学位论文 前3条
1 赵光亮;基于半连接算法的分布式数据库系统查询优化技术[D];浙江工业大学;2013年
2 李川;分布式数据库查询策略优化的研究[D];西安电子科技大学;2012年
3 曾海群;蚁群聚类算法研究[D];中南大学;2008年
本文编号:2881125
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2881125.html