基于Spark的关键蛋白质预测算法及shuffle内存优化策略研究
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图2-1蛋白质相互作用网络??Figure?2-1?Protein-protein?interaction?network??
络的研宄与分析,能够更好的帮助人们理解细胞的生命活动,有效的进行疾病防治??[36】。从图论的角度来看,蛋白质相互作用网络就是一张图,如图2-1所示。??图2-1蛋白质相互作用网络??Figure?2-1?Protein-protein?interaction?network??....
图2-2?map的计算逻辑??Figure?2-2?The?computational?logic?of?map??
例如map计算操作,它表示父RDD的每个partition的数据经过compute函数??计算映射到子RDD的对应的partition,每个RDD中的partition之间互不干扰,它??的RDD计算逻辑如图2-2所示。??RDDl?RDD2??map?计算??partition....
图2-3?reduceByKey的计算逻辑??Figure?2-3?The?computational?logic?of?reduceByKey??
调度管理集群资源。接下来简单介绍一下standalone模式的大致结构。??—个标准的standalone模式集群有以下四大角色:Driver、Master、Worker、??Executor。具体如图2-4所示。??14??
图2-4?Standalone集群的角色??Fiure?2-4?Roles?of?standalone?Cluster??
paitition5?::滅丨?u戀:::|??图2-3?reduceByKey的计算逻辑??Figure?2-3?The?computational?logic?of?reduceByKey??从图中可以看出,在map端计算完成后,RDDI的每个partition的数据都会??....
本文编号:3894343
本文链接:https://www.wllwen.com/projectlw/swxlw/3894343.html