当前位置:主页 > 科技论文 > 基因论文 >

基于GPU的大豆基因数据分析方法的研究

发布时间:2017-10-07 02:31

  本文关键词:基于GPU的大豆基因数据分析方法的研究


  更多相关文章: GPU并行 大豆启动子 调控元件识别 基因关联分析


【摘要】:随着生物领域高通量测序技术的出现,海量生物数据不断涌现,但是不完美的算法以及数据量的制约使得生物信息处理效率依然不高,因此,优化算法以及采用并行手段进一步提升数据处理效率显得十分必要。本文以大豆基因数据作为研究对象,对大豆基因编码区和非编码区的数据处理方法进行了优化和并行处理。主要的工作内容包括:首先,本文对大豆基因非编码区的启动子数据处理过程进行研究,对其中涉及的调控元件定位算法进行了优化,针对算法中存在冗余匹配问题,提出了基于反向匹配的调控元件定位算法,并对启动子数据中存在代表重复序列的连续字符N进行了特殊处理,采用跳跃式处理方法进行优化。其次,在对串行算法优化的基础上,本文采用GPU并行技术对大豆启动子数据处理过程进行多种并行方式的实现。单GPU并行方面,讨论了并行线程设置原则,实现了一级并行和两级并行。在多GPU并行方面,规划各GPU任务安排,实现了多GPU并行,并从访存方面进行了优化。最终,经过优化、并行处理后的大豆启动子数据处理效率提高了两个数量级。第三,本文对编码区的基因表达数据生成关联规则过程进行并行研究,分析了基因表达数据的特点,提出二进制位组合方式的非递归生成关联规则算法,并进行了GPU并行,新算法突破了递归算法GPU并行时的局限。最后对实验结果进行了分析,指出了算法的优势和存在的问题。
【关键词】:GPU并行 大豆启动子 调控元件识别 基因关联分析
【学位授予单位】:黑龙江大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:Q943.2;TP338.6
【目录】:
  • 中文摘要4-5
  • Abstract5-9
  • 第1章 绪论9-15
  • 1.1 课题研究背景、目的和意义9-10
  • 1.2 国内外同类课题研究现状及发展趋势10-13
  • 1.3 本文主要研究内容13-14
  • 1.4 本章小结14-15
  • 第2章 生物数据分析相关理论和技术15-26
  • 2.1 相关理论15-19
  • 2.1.1 调控元件识别16-18
  • 2.1.2 频繁项集挖掘18-19
  • 2.1.3 基因功能注释19
  • 2.1.4 基因关联分析19
  • 2.2 并行技术19-25
  • 2.2.1 GPU并行技术20-23
  • 2.2.2 Open MP并行技技术23-25
  • 2.3 本章小结25-26
  • 第3章 基因调控元件定位算法优化26-38
  • 3.1 问题描述26-28
  • 3.2 算法的优化28-32
  • 3.2.1 基于反向匹配的优化算法28-30
  • 3.2.2 特殊数据形式的处理30-32
  • 3.3 实验结果与分析32-37
  • 3.3.1 有效数据的获取32-33
  • 3.3.2 实验环境33-34
  • 3.3.3 优化算法与原算法效率比较34-37
  • 3.4 本章小结37-38
  • 第4章 基于GPU的大豆启动子数据处理算法38-59
  • 4.1 启动子数据处理过程38-43
  • 4.2 单GPU并行算法43-52
  • 4.2.1 一级并行算法的设计与实现44-47
  • 4.2.2 两级并行算法的设计与实现47-49
  • 4.2.3 实验结果与分析49-52
  • 4.3 多GPU并行算法52-58
  • 4.3.1 多GPU并行算法的设计与实现52-54
  • 4.3.2 并行算法的优化54-55
  • 4.3.3 实验结果与分析55-58
  • 4.4 本章小结58-59
  • 第5章 基因表达数据的GPU关联规则生成算法59-76
  • 5.1 基因表达数据处理过程59-64
  • 5.1.1 主要算法描述60-63
  • 5.1.2 有效数据的获取63-64
  • 5.2 基于GPU的关联规则生成递归算法64-67
  • 5.2.1 并行算法的实现64-66
  • 5.2.2 实验结果与分析66-67
  • 5.3 基于GPU的非递归关联规则生成算法67-74
  • 5.3.1 非递归关联规则生成算法67-70
  • 5.3.2 并行算法的实现70-72
  • 5.3.3 实验结果与分析72-74
  • 5.4 本章小结74-76
  • 结论76-78
  • 参考文献78-82
  • 致谢82-83
  • 攻读学位期间发表的学术论文及申请的专利83

【相似文献】

中国期刊全文数据库 前6条

1 ;31个大豆基因组重测序揭示遗传多样性和进化选择模式[J];科学观察;2011年01期

2 Paul Christou;孙雷心;;大豆基因工程——转基因植物的商业化生产[J];生物技术通报;1991年09期

3 ;ISAAA信息[J];中国生物工程杂志;2010年01期

4 窦新田,李晓鸣,李新民,周继松,李树藩,周俊初,沈辉,张忠明,胡志浩,彭文涛,胡福荣,陈华癸;大豆基因工程根瘤菌田间结瘤和共生固氮效应[J];生物技术;1991年03期

5 何德功;可以治疗缺铁的米[J];世界发明;2003年12期

6 ;[J];;年期

中国重要会议论文全文数据库 前1条

1 刘建中;;利用病毒诱导的基因沉默技术解析大豆基因功能[A];从植物科学到农业发展——2012全国植物生物学大会论文集[C];2012年

中国硕士学位论文全文数据库 前3条

1 蔡宇鹏;CRISPR/Cas9介导的大豆基因组定点编辑研究[D];中国农业科学院;2016年

2 郑金亮;基于GPU的大豆基因数据分析方法的研究[D];黑龙江大学;2016年

3 刘晓彬;TRV介导的大豆基因瞬时沉默体系建立及其在大豆基因功能分析中的应用[D];河北农业大学;2015年



本文编号:986430

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/986430.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户53112***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com