当前位置:主页 > 理工论文 > 生物学论文 >

基于基因本体降维的蛋白质功能预测研究

发布时间:2024-05-06 20:33
  蛋白质是活细胞生命活动中最主要的载体,执行着生物体内各种重要功能。对蛋白质功能进行自动标注是生物信息学领域的关键问题,也是后基因组时代的核心问题之一。准确全面地对蛋白质进行功能标注,不仅能帮助人们正确理解生命机理,而且对疾病分析、药物研发、农作物促产等研究领域都有着极大的促进作用。基因本体(Gene Ontology,GO)是一种在蛋白质功能预测中被广泛使用的功能标注数据库。本体中包含多于45000个功能标签术语,但是一个蛋白质仅被其中的几个或者几十个功能标签标注,且这些标签间存在复杂的结构关系,给蛋白质功能预测工作带来了巨大挑战。本文结合基因本体建模及其降维学习,进行蛋白质功能预测研究,主要工作如下:(1)提出一种基于基因本体图哈希的蛋白质功能预测方法(HashGO)。该方法首先利用基因本体图结构定义功能标签间的分类相似度,然后将该相似度结合到图哈希技术中并优化一系列哈希函数,再以二进制的形式编码大规模的功能标签术语。其次,利用这些哈希函数将蛋白质-功能标签关联矩阵映射到低维哈希空间,基于海明距离计算蛋白质之间的语义相似度。最后,HashGO基于语义近邻蛋白质的功能预测蛋白质功能。在...

【文章页数】:73 页

【学位级别】:硕士

【部分图文】:

基于基因本体降维的蛋白质功能预测研究



图1-1本文中蛋白质功能预测动机图但是在巨大的功能标签空间中,一个蛋白质仅被当中的几个或者几十个标注,大量的功能标注信息是缺失的,这一现象给蛋白质预测工作带来一定的挑战。而蛋白质功能标注信息对蛋白质机理的解析,疾病机理分析与调控,相关药物的研发,生物能源开发等具有极大的指导作....


基于基因本体降维的蛋白质功能预测研究



基因本体的层次结构可以被用来显著地提高蛋白质功能预测的精度。现有的功能标签压缩方法要不在压缩前隐式地或部分地利用功能标签间的关联关系,要不就是便于后期处理将基因本体的有向无环图结构变成无向结构。鉴于此,这些方法不能很好地服从GO层次结构,导致预测性能受损。为了解决这些基于本体....


基于基因本体降维的蛋白质功能预测研究



在统计差异性检验中,涉及的p值是某方法相较于其他方法间的差异性概率值,如果p值小于0.05,我们就说该方法具有显著性差异性。本文,我们在所有物种和所用度量上使用符号秩检验去统计HPHash和其他方法中的预测差异性,p值比10-9还要小。此外,我们也统计Hash....


基于基因本体降维的蛋白质功能预测研究



西南大学硕士学位论文支上分别涉及的功能标签数为13150、3618和1668,当d被设置为5或者10时,哈希编码的长度210log1668是不满足所有功能标签的编码位数。碰撞可能会导致哈希冲突,从而会影响蛋白质功能预测的结果。图4-1记录了在人类数据....



本文编号:3966309

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/3966309.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c8339***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com