当前位置:主页 > 科技论文 > 搜索引擎论文 >

混合异构架构上的生物大数据并行计算研究

发布时间:2020-12-16 18:47
  本文主要的研究内容是生物大数据在多种高性能异构计算架构下的并行计算方法,主要解决了三方面的挑战:(ⅰ)在有限的内存空间中对大规模数据集执行计算的方法,(ⅱ)基于异构计算的多层级的算法并行化设计方法和(ⅲ)对不同架构计算设备的硬件抽象建模方法。在这三方面的研究中,抽象硬件模型是最重要的贡献,提供了一个良好的抽象硬件底层,将框架设计和具体硬件分离,简化了软件框架,可以使软件框架快速扩展覆盖多种硬件架构,并能够以简便抽象的方式控制内存布局。同时提供了一个简化的硬件视角,抽象出影响性能的关键因素,进而在此基础上设计效率更高的并行方法。由于高通量测序技术的快速进展,在过去的十年中,生物序列数据的数量出现了爆炸性增长。生物学家存在分析和理解这些数据的强烈需求,因为基因序列决定了蛋白质的生物结构以及功能。但是,生物数据的可用性并不随着数据库的膨胀而增加。事实上,目前生物数据库的数据量如此之大以至于传统的数据分析方法已不足以快速执行涉及多种数据类型的生命科学查询。另一方面,近年来的计算力增长主要体现在新兴体系结构上,如GPU,Xeon Phi和基于Alpha指令集的国产申威众核处理器上。新兴体系结构呈... 

【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:134 页

【学位级别】:博士

【部分图文】:

混合异构架构上的生物大数据并行计算研究


图3.1比对沿着一组序列推进的示愆阁

框架图,数据并行,框架,序列


??图3.1比对沿着一组序列推进的示愆阁。坫两个序列之问的断点空14残祜填充,川红??色农示。??据库序列组的方式。在图3.1中,我们首先对数据库序列填充,使其填充后的长度??为4的倍数,这样可以减少底层代码中的执行路径分支,从而提升计算效率。将??填充后的序列16条为一组,写人到二维的16通道的内存缓冲区中,以适应Xeon??Phi上512位VPU的16个通道。在将二维缓冲区序列化写入内存的过程中,来??自不同序列的字符被写人相邻的内存地址,使得计算设备在并行读取多条序列的??过程中能够提高高速缓存命中率。另外,考虑到主机端的CPU所使用的SSE指??令集同样能够将每一个向量划分成16个通道执行计算,该二维缓存对于CPU和??Xeon?Phi而言是通用的。值得注意的是

序列,构造方法,分数,序列


这里私叫是查询序列,它的长度为g/e?。dZw叫是数据库主序列,办/en是它的长??度。其中的■B/ocfe&ad方法即为块搜索方法,见算法3.2。Shuffle方法被用来高??效地构建分数谱,以便于计算函数高效访问得分矩阵[94],它的工作过程如图3.3。??图3.4展示了组搜索方法的整体计算过程,我们在本章中称之为单遍方法。??由于Xeon?Phi上的寄存器/缓存资源有限,我们将分配给Xeon?Phi的序列组??进一步划分为一组连续的区块(见图3.1)。在比对计算过程中,沿着该区块的同??一行的]6个残基将以细粒度并行方式与查询序列进行比对计算。这个过程一直??持续到序列组内的所有区块均扫描完毕。图3.1示意了沿着二维16通道序列组的??推进计算的方式。我们还发现,在移动到下一个查询残基之前,计算数据库序列??缓冲区中的四个连续残基可以提高捜索效率。所以我们已经使每个区块由64个??(16x4)残基组成。特别的,当二维缓存中的某一条序列结束时,当前通道中会??出现一个断点。在这种情况下,首先序列记录当前序列中的分数,然后重置该通??道对应的迅

【参考文献】:
期刊论文
[1]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG.  Science China(Information Sciences). 2016(07)



本文编号:2920613

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2920613.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户31113***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com