基因本体和生物通路数据在筛选潜在疾病基因中的应用

发布时间:2021-05-26 16:40
  疾病基因的确定是基因组学从科研走向应用的重要步骤,目前已经有了大量的相关研究,其中筛选潜在疾病基因是生物信息学领域目前的研究热点。疾病基因的确定流程周期长,需要筛选出潜在疾病基因,进行生物实验来确定疾病基因。传统的筛选方法,例如定位克隆、全基因组关联分析、连锁分析等方法存在候选基因数量多,真正疾病基因少的问题。在筛选潜在疾病基因中,准确且不遗漏的找出尽可能多的疾病基因是核心问题。本文研究了基因本体和生物通路两种模式数据在筛选潜在疾病基因中的应用,分别使用两种数据计算基因功能相似度,以基因功能相似度为特征应用机器学习分类模型,筛选潜在疾病基因。与传统的方法相比,筛选出的潜在疾病基因数量更少,能缩短疾病基因确定的时间周期,降低疾病基因确定的成本。主要工作包括:(1)提出了一种改进的基于基因本体识别疾病基因的方法。现有的方法认为“疾病基因会在基因本体的生物过程分支上聚集”。本文认为“疾病基因会在基因本体的所有分支上聚集”,提出了全分支聚集方法(Full Branch Aggreation,FBA)。在计算基因本体术语相似度和基因功能相似度时,使用基因本体的所有分支。在自闭谱系障碍疾病基因数据... 

【文章来源】:南华大学湖南省

【文章页数】:62 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景和意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 基于基因本体的方法
        1.2.2 基于生物通路的方法
        1.2.3 其他方法
    1.3 主要研究内容
    1.4 本文组织结构
第2章 相关理论
    2.1 疾病基因识别
    2.2 基因本体
    2.3 生物通路及Pathcard
第3章 基于基因本体的疾病基因识别
    3.1 引言
    3.2 技术流程
        3.2.1 技术流程
        3.2.2 数据集
    3.3 疾病基因的识别流程
        3.3.1 基因本体术语相似度计算
        3.3.2 基于基因本体的基因功能相似度
        3.3.3 基于机器学习的疾病基因分类
    3.4 实验和结果分析
        3.4.1 实验流程
        3.4.2 结果分析
    3.5 本章小结
第4章 基于基因关联网络的基因本体术语扩展方法
    4.1 引言
    4.2 技术流程
        4.2.1 技术流程
        4.2.2 数据集
    4.3 基于生物通路的功能相似度计算
    4.4 实验与结果分析
        4.4.1 实验流程
        4.4.2 结果分析
    4.5 本章小结
第5章 总结与展望
    5.1 本文工作总结
    5.2 未来展望
参考文献
作者攻读硕士学位期间的科研成果
致谢


【参考文献】:
期刊论文
[1]高血压家族成员中高血压发病危险因素的研究[J]. 华琦,黄蔚,邢绣荣,马湘涛,高敬,李梅,刘荣坤,杨峥,顾东风.  中华流行病学杂志. 2005(01)

硕士论文
[1]基于复杂网络结构可控性的致病基因识别方法研究[D]. 王婉宁.西安理工大学 2019
[2]基于蛋白互作网络识别疾病相关的基因功能模块[D]. 李晴晴.黑龙江大学 2019
[3]基于拓扑及语义相似性的生物网络疾病模块挖掘算法研究[D]. 祝火乐.安徽大学 2019
[4]基于生物网络的疾病基因的识别与分析[D]. 吴慧慧.江南大学 2018
[5]基于逻辑回归的多数据融合鉴别致病基因[D]. 李乐.西安电子科技大学 2018
[6]基于模块归一化及自适应跳转随机游走的疾病基因预测[D]. 袁杰.华中师范大学 2016
[7]基于时序网络的蛋白质复合物挖掘与疾病基因预测研究[D]. 赵艳丽.华中师范大学 2015
[8]基于PPI网络的疾病候选基因排名方法研究[D]. 黎琦.中南大学 2014



本文编号:3206703

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3206703.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dfdca***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com