当前位置:主页 > 科技论文 > 自动化论文 >

基于多信息融合的蛋白质翻译后修饰位点预测研究

发布时间:2024-05-19 22:57
  蛋白质翻译后修饰是蛋白质在翻译后发生的化学修饰,在生命过程中起着至关重要的调控作用。深入研究鉴定蛋白质翻译后修饰位点,对揭示生命活动的机理、筛选疾病的临床标志物、鉴定药物靶点等方面具有重要意义。本文基于机器学习和多信息融合对蛋白质翻译后修饰位点进行研究,研究内容如下:1.提出一种新的蛋白质S-亚磺酰化位点预测方法SulSite-GTB。首先,基于多种蛋白质特征信息,包括二肽组成(dipeptide composition,DC)、氨基酸组成(amino acid composition,AAC)、分组重量编码(encoding based on grouped weight,EBGW)、K近邻得分(K nearest neighbors scores,KNN)、位置特异性氨基酸倾向(position-specific amino acid propensity,PSAAP)、位置权重氨基酸组成(position-weighted amino acid composition,PWAAC)和伪位置特异性得分矩阵(pseudo-position specific score matrix,...

【文章页数】:80 页

【学位级别】:硕士

【部分图文】:

图2-1蛋白质序列中氨基酸之间的紧邻相关模式图

图2-1蛋白质序列中氨基酸之间的紧邻相关模式图

青岛科技大学研究生学位论文92011202011,120,2120kkukkffpf(2-4)是权重因子,设置为0.05。f是蛋白质序列中第个氨基酸的出现频率。k是第k级序列相关因子,如图2-1所示。图2-1蛋白质序列中氨基酸之间的紧邻相关模式图Fig.2-1Proteinseq....


图3-1SulSite-GTB预测模型的流程图

图3-1SulSite-GTB预测模型的流程图

基于多信息融合的蛋白质翻译后修饰位点预测研究32图3-1SulSite-GTB预测模型的流程图Fig.3-1FlowchartoftheSulSite-GTBpredictionmethodSulSite-GTB方法的步骤描述为:(1)获取训练数据集和独立测试集,S-亚磺酰化和非....


图3-2训练数据集S-亚磺酰化和非S-亚磺酰化的序列标识对比图

图3-2训练数据集S-亚磺酰化和非S-亚磺酰化的序列标识对比图

青岛科技大学研究生学位论文33置于片段序列的中间,侧翼氨基酸的位置描述在-10至+10的范围内,分析的结果如图3-2所示。图3-2训练数据集S-亚磺酰化和非S-亚磺酰化的序列标识对比图Fig.3-2ComparisonofsequenceidentificationofS-sul....


图3-3训练集关于不同特征的预测结果

图3-3训练集关于不同特征的预测结果

基于多信息融合的蛋白质翻译后修饰位点预测研究36训练数据集关于不同特征提取算法的预测结果如表3-3所示。此外,本文还使用ROC和PR曲线,比较在不同特征提取算法下预测模型的鲁棒性[32]。图3-3是训练集在八种特征提取方法下得到的ROC曲线和PR曲线。从表3-3中可以看出,使用二....



本文编号:3978577

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3978577.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5c410***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com