基于多组学数据的本体注释与知识图谱构建方法研究

发布时间:2021-09-22 14:39
  随着测序技术的不断发展,测序费用逐年降低,各国相继发展了大规模精准医疗计划。随着这些大规模精准医疗计划的实施,相关的生物数据呈爆炸式增长。当前对于如何管理和分析海量的生物变异数据是目前生物信息学研究人员面临的巨大难题之一。虽然有不少基于变异数据的管理软件,但是大部分没有与本体数据结合,然而这些本体信息数据在疾病研究、分子诊断上有着不可忽视的作用。精准医疗计划的实施离不开复杂性疾病的研究。复杂性疾病是由基因或环境等多领域因素导致的疾病。在治疗复杂性疾病时,单一组学数据的分析往往是不够的,而是需要基于多组学知识进行全方位的理解。然而这些组学数据往往存储在不同的数据库中,给生物医学工作者来了极大的不便。因此基于多组学数据对变异文件进行本体注释,构建多组学知识图谱是未来生物医学领域重要课题之一。本文主要研究成果如下:(1)研究了测序分析工作流与本体注释方法。本文选择较流行的比对和变异检测软件搭配,完成了DNA二代、DNA三代和RNA测序。并基于检测的变异文件,开发了本体注释方法,通过该方法可以将本体信息注释到变异文件上,在一个文件上整合多个数据库,极大的提高了查询效率。(2)搭建了多组学知识图... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:74 页

【学位级别】:硕士

【部分图文】:

基于多组学数据的本体注释与知识图谱构建方法研究


FASTA文件示意图

基于多组学数据的本体注释与知识图谱构建方法研究


VCF文件示意图

基于多组学数据的本体注释与知识图谱构建方法研究


DNA二代测序Fig.2-5Next-generationDNAsequencing

【参考文献】:
期刊论文
[1]PacBio Sequencing and Its Applications[J]. Anthony Rhoads,Kin Fai Au.  Genomics,Proteomics & Bioinformatics. 2015(05)
[2]基于疾病本体的疾病相似性计算方法[J]. 李杰,初砚硕,程亮,王亚东,孔蕾蕾.  生物化学与生物物理进展. 2015(02)
[3]在线孟德尔人类遗传数据库数据挖掘的研究进展[J]. 李建华,李哲人,康雁,李岭.  生物医学工程学杂志. 2014(06)

博士论文
[1]基因本体术语相似度计算和扩展方法研究[D]. 彭佳杰.哈尔滨工业大学 2015

硕士论文
[1]组学大数据变异分析关键技术与系统研发[D]. 刘图明.哈尔滨工业大学 2017
[2]文物知识图谱构建与检索关键技术研究与实现[D]. 林炀平.浙江大学 2017



本文编号:3403926

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3403926.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户59856***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com