当前位置:主页 > 科技论文 > 基因论文 >

基于异构信息融合的致病基因预测算法研究

发布时间:2021-07-12 04:50
  复杂疾病严重影响人的身心健康,发现疾病致病基因是医学领域一直以来的研究目标。随着生物信息学的出现及生物技术的快速发展,为了克服传统生物医学方法实验周期长、成本高等固有困难,研究者提出许多利用大量生物数据挖掘疾病致病基因的基因优先排序算法。但由于目前已知的基因-疾病关联矩阵仍然非常稀疏,并且缺少基因-疾病之间无关的证据,对基因优先排序算法预测性能造成一定影响。基于功能相近的基因突变可能引发类似的疾病这一假设,本文提出一种基于异构信息融合的PU归纳矩阵补全算法PUIMCHIF(PU Induction Matrix Completion with Heterogeneous Information Fusion)预测人类疾病的候选致病基因。一方面,PUIMCHIF使用不同的紧凑特征学习方法从多种数据源提取基因和疾病的特征,弥补数据稀疏的不足。具体地,使用带重启的随机游走和扩散分量分析方法学习基因和疾病低维的网络特征;使用去噪自编码对基因和疾病的高维数据特征进行降维。另一方面,基于未知的基因-疾病关联关系中多数是无关关系的先验知识,我们采用PU-Learning的策略,将未知的无标记数据视为... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:57 页

【学位级别】:硕士

【部分图文】:

基于异构信息融合的致病基因预测算法研究


基因与疾病的关系示意

异构网络,示例,表现型


哈尔滨工业大学硕士学位论文该算法同时对表现型和基因进行排病相关的基因和表型,并且选择排型。因此,与该表型相关的疾病应该因、表现型和基因-表现型三个数据PI 数据,如果编码的蛋白质相互作使用 MimMiner 计算方法。每个表相应的相似度评分对边缘进行加权。相关基因连接构建异构网络,如图

示意图,异构网络,示意图,相似性


图 2-2 Katz 异构网络示意图基于图的算法,假设已知一个无向无权图的对称邻示图中节点 i 与节点 j 是连接的,同理 0ijA 表示图的。那么计算图中任意两个节点之间的相似性的方点 j 不同路径长度条数获得,可以用矩阵的幂 lA 计不同长度路径,得到一个单一的相似性度量。因l ,则节点 与节点 j 相似性被定义为: 1 klij lijlS β A 个常数,用于抑制较长的路径长度。则整个相似性 1 klllS β A 1]的研究,我们可以把 S 看作根据级数展开定义的 k ,只需要满足当 l 时, 0β 。则根据β


本文编号:3279237

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3279237.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户284f5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com