当前位置:主页 > 科技论文 > 搜索引擎论文 >

关键蛋白质预测及蛋白质变体表征算法研究

发布时间:2021-03-28 21:27
  蛋白质是生命过程的主要执行者。关键蛋白质作为维持细胞生命的重要组成部分,在生物学和药物设计研究中发挥着重要作用。与基因变异相比,蛋白质的分子结构及状态变化(即蛋白质变体)与疾病的病理变化更相关。表征蛋白质变体包括鉴定和定位蛋白质中的主要结构性变异(PSA),对推进医学事业发展具有现实意义。本文着力于从蛋白质组学领域中两个重要研究方向进行研究,主要创新点如下:随着关键蛋白质相关的大量生物学数据的产生,已经提出越来越多的计算方法用于预测关键蛋白质。与采用单种机器学习方法或集成多种机器学习方法的预测方法不同,本文设计出XGBFEMF预测框架用于预测关键蛋白质。该框架包括SUB-EXPAND-SHRINK方法,该方法利用初始特征构建复合特征并获得用于关键蛋白质预测更好的特征子集;还包括用于获得更有效的预测模型的模型融合方法。本文使用酵母数据进行实验,通过接受者操作特性曲线(ROC)分析、准确度分析和top分析来评估XGBFEMF框架的性能。同时,本文还使用大肠杆菌数据进行实验,以验证该框架的通用性。实验结果表明,XGBFEMF框架可以有效地改进多项关键性指标。随着质谱技术的发展,使得基于自顶向... 

【文章来源】:湖南师范大学湖南省 211工程院校

【文章页数】:55 页

【学位级别】:硕士

【部分图文】:

关键蛋白质预测及蛋白质变体表征算法研究


图2-1基于自顶向下质谱技术表征蛋白质变体的框架图??

变体,蛋白质,自顶向下,质谱


?关键蛋白质预测及蛋白质变体表征研究???2.2.1蛋白质变体鉴定算法??当前基于自顶向下质谱技术的蛋白质变体鉴定方法可分为两大类:(1)扩展蛋白质变??体数据库方法;(2)曹PSA搜索方法,该方法可进一步分为三大卷蛋白质变体鉴定算??法的分类如图2-2所示。??[?Proteoform?^??identification?methods??■?I????1?'?,■丨?.??广?The?expanded?|?The?blind?PSAs??proteoform?database?I?search?methods??L?methods?)?r?、?i?,,?、??’?Spectral?^?f?Graph?^?Precursor?ion^??alignment-based?model-based?independence??、algorithms?J?v?algorithms?y?v?algorithm?y???1?I?" ̄ ̄1??ProSight,?MascotTD,||?MS-TopDown^]?(?|??BUPID-top-down,?M^AIign+,?pTop,Tc)pMG,???gle,?MS-A'ign-E?MSPathFinder?P,ITA??Meta?Morpheus,?MASH?Suite?Pro,??^?TDPortal?JljopPIQSPECTRUMJ?[?J?[?y??图2-2基于自顶向下质谱技术的蛋白质变体鉴定算法的分类??2.2.1.1扩展蛋白质变体数据库方法??扩展蛋白质变体数据库方法实质上是根据数据庠中的注释信息自动枚举所有可能的??蛋_质变

曲线,数据集,酵母,方法


17)??在公式(3-10)至公式(3-17)中,IF表示真阳性蛋白质的数量;沖表示假阳性蛋??白质的数量W転真阴性蛋白质的数量;所■叚阴性蛋麵勺数量。??3.4.2与现有方法比较??酵母数据集和大肠杆菌数据集均属于不平衡数据集,本文按照数据集中关键蛋白质与??非关键蛋白质的原始比例将其分为10份。选择其中1份作为测试集,剩佘9份作为训练??集。谢i程重复10次,直到10份中的任意1份都作为一次测试集,然后通过ROC曲线??下面积(AreaUnderCurve,AUC)显不其性能。图3-2和图3-3分别显不了基于酉孝母数据??集和大肠杆菌数据集XGBFEMF和其他初始特征方法的ROC曲线。??!?=11??。-?=距=??([///???PeC:〇〇7|331??\?fiV?/?/???P&E:?0.6884??////?/,???XGBFEMF:?0.7829??:v??o??I?I?I?I?I?I??0.0?0.2?0.4?0.6?0.8?1.0??False?positive?rate??图3-2基于酵母数据集XGBFEMF和其他初始特征方法的ROC曲线??16??

【参考文献】:
期刊论文
[1]A Feature Selection Method for Prediction Essential Protein[J]. Jiancheng Zhong,Jianxin Wang,Wei Peng,Zhen Zhang,Min Li.  Tsinghua Science and Technology. 2015(05)



本文编号:3106270

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3106270.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1e932***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com