当前位置:主页 > 医学论文 > 临床医学论文 >

基于基因网络的致病基因预测算法研究

发布时间:2017-07-05 02:08

  本文关键词:基于基因网络的致病基因预测算法研究


  更多相关文章: 致病基因预测 信息散度 相关系数 随机游走算法 逻辑回归模型


【摘要】:致病基因的研究是对遗传疾病的治疗具有重要的意义。近年来,高通量测序技术的高速发展为致病基因的研究带来了新的机遇,并涌向出大量的致病基因研究方法。这些方法基于已有的疾病或表型与基因之间的因果关系,使用网络构建方法对致病基因进行排序,从而达到致病基因筛选的目的。它们大多基于一个前提,即致使相同或相似疾病发病的基因在基因生物网络中邻近,存在着模块特性。但现有的方法对生物实体网络的邻接矩阵的构建较为粗糙,即存在关联关系的为1,否则为0,无法对基因之间的关联关系进行更合理的量化。此外,高通量测序技术产生了大量生物数据,使得集成数据分析方法成为目前致病基因研究的主要手段,但大多数方法都是基于生物实体的局部信息进行特征的构建,没有更好的扩展利用生物实体网络的拓扑特性。本课题研究的工作主要包括:第一,从另一种角度引入了研究生物实体间关系的方法,通过考察生物数据分布规律,来量化生物实体间的相对重要程度。基于此本课题引入两种统计特征量化数据间的关系。一种是计算基因表达数据的相关系数,用于分析基因间在功能上或者调控上对整个基因网络的重要程度;另一种是计算基因表达数据的信息散度,将基因的表达值作为基因表达的概率来量化基因间的表达分布,以此得到基因间的相互重要关系;与蛋白质交互网络数据的比对实验表明这两种统计特征的AUC、Top1和Top50在致病基因预测问题上优于后者,验证了所引入的两种统计特征对致病相关基因筛选的有效性。第二,提出一种随机游走算法的二元逻辑回归模型用于致病相关基因的预测。利用随机游走模型,对每一个基因进行关联基因的筛选,从得到与这个基因关联性强的基因中,分别从个数和权重这两个方面统计这些基因的全局信息,并用来构建基因的特征向量,得到了特征F1、特征F2和特征F3。第三,在特征F1下,三个不同的生物数据网络:蛋白质交互网络、基因共表达网络和基因通路网络中本章方法得到的AUC明显优于B Chen等人提出的特征“PCF1”、MRF算法和RWR算法得到的结果。在F2特征下,三个不同的生物数据网络中,本课题提出的算法的AUC结果高于B Chen等人提出的特征“PCF2”得到的结果。在特征F3下集成三种网络,本章提出的方法的AUC结果显著优于MRF算法、RWR算法、DIR算法和B Chen等人提出的特征“PCF3”的结果。此外还从时间效率上对这几种不同算法进行了比对,验证了本章算法更具有竞争力。
【关键词】:致病基因预测 信息散度 相关系数 随机游走算法 逻辑回归模型
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R440
【目录】:
  • 摘要4-5
  • ABSTRACT5-9
  • 第1章 绪论9-16
  • 1.1 课题研究的背景和意义9-10
  • 1.2 国内外研究现状10-13
  • 1.3 主要研究内容和论文组织结构13-16
  • 1.3.1 主要研究内容13-14
  • 1.3.2 本文组织结构14-16
  • 第2章 基于基因表达数据的致病基因排序16-29
  • 2.1 引言16-17
  • 2.2 基于基因表达数据的统计特征17-19
  • 2.2.1 构建相关系数特征向量17
  • 2.2.2 构建信息散度特征向量17-18
  • 2.2.3 评价指标18-19
  • 2.3 基于统计特征的致病基因排序算法19-20
  • 2.4 实验验证及分析20-28
  • 2.4.1 开发环境20-21
  • 2.4.2 实验数据21-22
  • 2.4.3 统计特征的有效性验证及分析22-28
  • 2.5 本章小结28-29
  • 第3章 基于逻辑回归的致病基因预测算法29-38
  • 3.1 引言29
  • 3.2 二元逻辑回归模型概述29-30
  • 3.3 基于逻辑回归的致病基因预测算法30-33
  • 3.3.1 基于二元逻辑回归预测模型30-32
  • 3.3.2 基于两步二元逻辑回归预测模型32-33
  • 3.4 随机游走的二元逻辑回归预测模型33-36
  • 3.4.1 基本原理33-35
  • 3.4.2 算法步骤35-36
  • 3.5 本章小结36-38
  • 第4章 实验仿真及结果分析38-51
  • 4.1 实验环境38
  • 4.2 实验数据38-39
  • 4.3 实验结果及分析39-50
  • 4.3.1 留一交叉验证39
  • 4.3.2 算法性能分析39-48
  • 4.3.3 算法效率分析48-50
  • 4.4 本章小结50-51
  • 结论51-53
  • 参考文献53-60
  • 攻读硕士期间发表的论文及其它成果60-62
  • 致谢62


本文编号:520129

资料下载
论文发表

本文链接:https://www.wllwen.com/linchuangyixuelunwen/520129.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户53fd2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com