当前位置:主页 > 科技论文 > 软件论文 >

基于Spark的CRISPR系统脱靶位点预测算法研究与实现

发布时间:2021-11-19 00:35
  基因编辑技术在基因功能研究、物种性状改良和疾病研究中具有非常重要的作用,成为当下的研究热点。CRISPR系统是目前最具发展潜力的基因编辑工具,但由于其存在脱靶效应,可能会导致不确定位置的DNA片段遭到破坏。提前对全基因组范围内存在的脱靶位点进行预测来实现风险规避,对安全有效的CRISPR系统的设计与应用具有非常重要的指导意义。目前已有的CRISPR系统脱靶位点预测算法的运行效率都不是很高,在全基因组范围对脱靶位点进行预测十分耗时。本文提出了一种新的脱靶位点预测算法Spark-OFFinder,该算法将FM-index算法应用到了脱靶位点预测当中,通过使用Spark分布式计算框架,使之能在Spark集群当中并发运行。本文对参考基因组序列生成FM-index索引文件,并对索引文件的内容进行压缩处理,使其能够完全加载到内存当中,提升读取效率。Spark-OFFinder设计了一种基于FM-index算法的部分模糊匹配算法,能在参考基因组序列中搜索CRISPR系统的脱靶位点,并通过一定的优化措施来缩小搜索空间,以提升算法的运行效率。本文还使用MapReduce编程模型将该算法并行化处理,并基于... 

【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校

【文章页数】:65 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 项目来源及研究内容
    1.4 论文结构
2 相关概念、算法及技术介绍
    2.1 CRISPR/Cas9 系统
    2.2 Burrows-Wheeler变换及后缀数组
    2.3 FM-index算法
    2.4 Spark分布式计算框架
    2.5 本章小结
3 基于Spark的 CRISPR系统脱靶位点预测算法
    3.1 CRISPR系统脱靶位点预测问题描述及分析
    3.2 对参考基因组序列生成FM-index索引文件
    3.3 CRISPR系统脱靶位点预测算法的设计与实现
    3.4 基于Spark的算法并行化处理
    3.5 本章小结
4 算法性能测试与结果分析
    4.1 测试数据及环境
    4.2 Spark-OFFinder单机性能测试与分析
    4.3 Spark-OFFinder集群性能测试与分析
    4.4 本章小结
5 总结与展望
    5.1 本文工作总结
    5.2 未来工作展望
致谢
参考文献


【参考文献】:
期刊论文
[1]CRISPR/Cas9系统中sgRNA设计与脱靶效应评估[J]. 谢胜松,张懿,张利生,李广磊,赵长志,倪攀,赵书红.  遗传. 2015(11)
[2]CRISPR/Cas9的应用及脱靶效应研究进展[J]. 郑武,谷峰.  遗传. 2015(10)
[3]FM-index分块并行算法及其实现[J]. 李开士,张云泉,李玉成.  计算机工程. 2008(08)



本文编号:3503922

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3503922.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b4308***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com