一种基于深度神经网络模型及蛋白相互作用预测癌症相关蛋白及蛋白组合的新方法
发布时间:2020-12-29 07:23
如何从大量数据中挖掘出有意义的信息,如何把复杂的研究对象用精确而简明的模型描述出来一直是数据处理工作中的中心课题。针对这个问题有两种截然不同的方法:数据挖掘和复杂网络理论。复杂网络和数据挖掘方法不仅有着相似的研究目的,而且其分析对象在多数情况下也相同。但在实验数据分析中将两者协同应用解决同一问题的情况比较少,主要原因是两者在分析对象上有较多重叠,在多数情况下仅用一种方式就可以解决问题。但实际上,将数据挖掘和复杂网络很好的结合起来解决问题会给数据分析提供新的思路。本研究将复杂网络和数据挖掘相结合,同时用于分析癌症相关基因/蛋白,结果表明复杂网络和数据挖掘技术的协同应用可以为生物学数据的分析提供新的切入点。对癌症的研究积累了大量而且类型丰富的数据,利用这些数据发现癌细胞中关键的基因及其作用途径一直是重要的研究方向。得益于丰富的数据,癌症领域的数据分析方法也层出不穷,其中结合蛋白质相互作用网络分析基因及蛋白功能的方法是一个重要的类别。在癌症相关的信号传导,细胞定位和表达调控等过程中蛋白质相互作用扮演重要的角色,因此以蛋白质相互作用为基础整合其它组学数据的生物信息方法对分析参与这些过程的关键基...
【文章来源】:华中农业大学湖北省 211工程院校 教育部直属院校
【文章页数】:104 页
【学位级别】:博士
【部分图文】:
使用深度神经网络模型预测癌症相关蛋白质和蛋白质组合的流程
图 2-2. KD score 预选的癌症相关蛋白质韦恩图(Pro: ProteomicsDB;字表示其中 TTD 的已知药物靶点数目)。Figure 2-2. The Venn diagram of prioritized cancer-related proteinsBioXpress and ProteomicsDB (Pro: ProteomicsDB; Bio: BioXprenumbers of proteins in TTD).2.3.1.2 预测的癌症相关蛋白质的功能分析在 TOP 500 个预选癌症相关蛋白质 ( 细胞系之间平均 质) 中,有 211 个已知的癌症药物靶点,再对剩余 289 个蛋(GO)富集分析发现 (表 2-1),这些蛋白质的功能主要富集于制相关功能,如 DNA 复制起始 (DNAreplicationinitiation:G(DNAreplication:GO:0006260) 等;(2) 代谢相关途径,如生物
) 一种基于蛋白质互作网络的方法 (使用本研究中的 PPI 数据) (Jian此方法筛选蛋白质互作网络中具有差异表达信息的蛋白质,并计算目的差异表达值正值之和作为评分策略优选蛋白质。) 一种基于蛋白质互作网络和改进打分策略的方法:此方法筛选蛋白具有差异表达信息的蛋白质,并使用与本研究中与计算 KDscore 评分对每个蛋白质评分。果显示 (图 2-3),基于深度神经网络模型的蛋白质筛选方法的受试者 (ROC)曲线下面积 (the area under the curve, AUC) 最大值接近 0.ress 和 ProteomicDB 两个数据集中都明显优于其它 3 种方法,说明本方和打分策略上都优于常规的差异表达值筛选法和基于蛋白质互作网络 et al., 2015)。
【参考文献】:
期刊论文
[1]Computational Approaches for Prioritizing Candidate Disease Genes Based on PPI Networks[J]. Wei Lan,Jianxin Wang,Min Li,Wei Peng,Fangxiang Wu. Tsinghua Science and Technology. 2015(05)
本文编号:2945256
【文章来源】:华中农业大学湖北省 211工程院校 教育部直属院校
【文章页数】:104 页
【学位级别】:博士
【部分图文】:
使用深度神经网络模型预测癌症相关蛋白质和蛋白质组合的流程
图 2-2. KD score 预选的癌症相关蛋白质韦恩图(Pro: ProteomicsDB;字表示其中 TTD 的已知药物靶点数目)。Figure 2-2. The Venn diagram of prioritized cancer-related proteinsBioXpress and ProteomicsDB (Pro: ProteomicsDB; Bio: BioXprenumbers of proteins in TTD).2.3.1.2 预测的癌症相关蛋白质的功能分析在 TOP 500 个预选癌症相关蛋白质 ( 细胞系之间平均 质) 中,有 211 个已知的癌症药物靶点,再对剩余 289 个蛋(GO)富集分析发现 (表 2-1),这些蛋白质的功能主要富集于制相关功能,如 DNA 复制起始 (DNAreplicationinitiation:G(DNAreplication:GO:0006260) 等;(2) 代谢相关途径,如生物
) 一种基于蛋白质互作网络的方法 (使用本研究中的 PPI 数据) (Jian此方法筛选蛋白质互作网络中具有差异表达信息的蛋白质,并计算目的差异表达值正值之和作为评分策略优选蛋白质。) 一种基于蛋白质互作网络和改进打分策略的方法:此方法筛选蛋白具有差异表达信息的蛋白质,并使用与本研究中与计算 KDscore 评分对每个蛋白质评分。果显示 (图 2-3),基于深度神经网络模型的蛋白质筛选方法的受试者 (ROC)曲线下面积 (the area under the curve, AUC) 最大值接近 0.ress 和 ProteomicDB 两个数据集中都明显优于其它 3 种方法,说明本方和打分策略上都优于常规的差异表达值筛选法和基于蛋白质互作网络 et al., 2015)。
【参考文献】:
期刊论文
[1]Computational Approaches for Prioritizing Candidate Disease Genes Based on PPI Networks[J]. Wei Lan,Jianxin Wang,Min Li,Wei Peng,Fangxiang Wu. Tsinghua Science and Technology. 2015(05)
本文编号:2945256
本文链接:https://www.wllwen.com/yixuelunwen/zlx/2945256.html