结构化对等网络的负载均衡问题研究
摘 要:
摘 要:针对结构化对等网络中负载不均衡问题的存在,本文分析了网络负载失衡的主要因素,并介绍了目前针对网络负载访问热点问题的三种主流处理技术。
关键词:
关键词:对等网络 负载均衡 热点
负载均衡是所有基于分布式哈希表(Distributed Hash Table,DHT)的对等网络((Peer-to-Peer network))都希望具有的属性,因为它能使得整个网络更高效地工作,更充分地利用每个网络成员的资源[1]。
负载不均衡主要是由于网络中各个计算机之间处理能力、存储能力等的不同,而由于查询请求的不均衡性,有的计算机存储的资源在某一时间段之内会成为网络中大家竞相访问的热点,从而有可能会超过该计算机的处理能力,导致计算机不响应甚至崩溃,这就会造成负载的不均衡。负载均衡的主要目的是为了有效利用网络中各计算机的资源,保证整个系统的可靠性。改善网络系统的负载平衡性,对于提升网络性能,保证稳定的服务质量具有重要的意义。
1 导致DHT网络负载失衡的因素
基于DHT的结构化对等网络具有自组织、扩展性好等优势,进而得到了广泛的应用。但在P2P环境下、节点的处理能力以及用户资源使用及查询的不均衡性,使P2P环境中的负载均衡成为一个突出、急需解决的问题。导致结构化对等网络负载失衡的因素包括以下几个方面。
1.1 散列的随机性
结构化对等网络的一大特点是应用分布式哈希表。基于DHT的结构化对等网络存在着节点空间划分不均和文件在节点间分布不均的问题。节点利用哈希函数产生标识符插入逻辑拓扑网络的相应位置,并且通过这种方式划分地址空间,承担网络负载。资源对象的存储位置也是通过对文件的关键字进行哈希运算,然后根据对象资源标识符决定的[2]。
1.2 逻辑空间与物理网络拓扑架构不一致性
结构化对等网络的逻辑拓扑结构与真实的物理拓扑结构不同。由于在逻辑空间中邻近的节点在物理上可能距离很远,导致逻辑空间中的最优路由路径,并不一定是物理空间中的最优。
1.3 网络中每个节点的处理能力、存储能力等之间存在着差异
由于网络的异构性,使得节点的处理能力亦不相同。在节点承载的地址空间相同的情况下,处理能力强的节点能较快地处理查询请求,而处理能力弱的节点可能无法及时处理查询请求而导致丢包现象[3]。
1.4 节点分配到的资源标识符空间的不均匀
在实际应用中,每个节点存储的资源的受欢迎程度并不相同,因此,查询请求具有不平衡性。用户需求高的对象资源访问率高,用户需求低的对象资源访问率低。
2 网络负载访问热点问题的解决策略
目前,针对访问热点问题的处理技术研究很多,本文摘取了以三种主流方法进行说明对比。
2.1 虚拟节点法
基于虚拟节点的方法的基本思想是当网络运行过程中某个节点因为访问频繁成为热点时,该超载节点就将自己一部分的负载通过与自己相连的虚拟节点向外转移到附近负载较轻的节点上,以此来达到负载均衡的目的。由于虚拟节点的引入,虚拟节点的维护需要花费一部分网络带宽,这给本来就不充裕的网络带宽增加了额外的压力。虚拟节点的引入对负载均衡的效果是在节点超载后进行的调节,对热点问题的效果就没对存储能力这类问题那样有效。
2.2 运用复制技术解决访问热点问题的策略
当网络中出现访问热点的时候,复制策略会对热点资源进行复制,并将复制的资源传给其他负载较轻的节点上,通过减小热点节点的访问量,最终达到负载均衡。由于副本复制策略的不同,基于文件复制技术的策略又可以分为以下三种类别。
2.2.1 在超载节点的邻居节点上创建副本
这是很多研究者所采用的方法,,当网络中某节点因为访问频繁导致超出该节点处理能力造成超载的时候,节点会采用复制策略对热点资源文件进行复制,然后选取邻居节点中负载较轻的节点,将副本放在该节点上,同时将该邻居节点的信息通知给请求节点,使接下来发出的请求指向该邻居节点,从而使超载节点的负载得到降低。当该节点与邻居节点同时成为访问热点时,按照上面的方法再去寻找邻居节点进行副本的创建和存储。
2.2.2 在超载节点的请求节点上创建副本
该副本创建策略会按照节点的负载程度设立一个阈值,当每次查询请求被转发到另外一个节点上的时候,该节点就对自身的负载情况进行判断。如果该节点的负载超过了设定的阈值,而发起请求的节点的负载较低的情况下,就将该节点上的热点文件在请求节点上创建副本。在创建副本的同时,系统还要把新创建的副本文件的位置通知给请求节点在查找过程中经过的各个节点。这样,在接下来的查找过程中,该副本位置就会在一次次的请求中被通知到网络中的各个节点,从而使得以后进行针对该文件的查询能够指向副本,从而降低热点节点的访问量,达到负载均衡的目的。
2.2.3 在超载节点查询请求的路径节点上创建副本
这种算法是在节点超载的时候,复制副本存到查询请求在到达目标节点时所经过的每一个节点上,这说明副本的复制是多个的,这样下次查询的时候不需要到达热点节点就可以找到该资源,既减少了跳数,又节省了访问时间。但是副本复制的数目过多会在整个网络中形成冗余,导致网络的存储空间的浪费。
由于副本复制实现起来比较简单而且容易操作,大家理解也容易,因此这种方法得到了大量应用,但是副本复制算法也有自身存在的问题,如副本维护的开销以及副本数量多少合适等问题仍是接下来研究的重点。
2.3 基于流言传播的方法
基于流言传播的方法主要是利用结构化网络维护中所进行的整个网络中的节点的周期性通信,在每一次通信的过程中附带超载节点上的热点资源的信息。这样也可以使访问在没有到达存储该资源的节点的时候就可以对热点资源进行访问。当网络中的某一节点在超载时,该节点就可以在周期性维护的时候主动将热点资源添加到通信信息中传递给其他节点,让其他节点替自己分担一部分负载,接到附带着热点资源信息的通信内容的节点,通过同样的方式将热点资源的信息发送出去。这样通过网络周期性的维护,整个网络中的节点会很快收到该热点资源信息,从而访问可以在其它节点上找到该资源,降低了存储热点资源节点的负载情况。另外,网络维护中传播热点资源的过程涉及到网络开销问题,因此不能让其无限制地往下传播,这就需要设置一个控制传播规模的步数,明确传播多少步之后就停止。该方法的好处就是利用了结构化p2p网络中各个节点必须进行的间隔性拓扑维护通信,流言在网络中的传播并没有引入额外的通信开销[4]。缺点是由于网络规模越大,流言的初始传播节点的负载减轻的效果越好。但是,不加控制的流言传播将增大节点的处理开销,所以对流言进行管理在实际中是一个重要的问题,将直接影响系统性能。
从三种方法的介绍中可以看出,复制技术是最容易实现,并且在复制的过程中整个网络比较稳定,不会产生剧烈的动荡。
参考文献:
[1]孙志强.DHT对等网络中负载均衡技术的研究[D].哈尔滨:哈尔滨工程大学,2009.
[2]肖文婷.结构化 P2P 网络负载均衡策略的研究[D].重庆:重庆大学,2014.
[3]罗慧君,徐洁,赖坤锋.结构化P2P自适应混合负载均衡策略[J].微计算机信息, 2008(36):6-7.
[4]陈晨.结构化对等网络中访问热点引起的负载均衡技术研究[D].北京:北京交通大学,2008.
[作者简介] 王杨(1981-),男,讲师。研究方向:计算机网络,计算机应用技术。石翠(1981-),女,副教授。研究方向:计算机应用技术。
(收稿日期:2014-11-18)
本文编号:14905
本文链接:https://www.wllwen.com/kejilunwen/wltx/14905.html