基于支持向量机的蛋白质结构类预测及蛋白质相互作用网络拓扑结构分析
发布时间:2021-07-13 15:05
随着蛋白质与基因测序技术的进一步发展,尤其是基因组计划的启动使得有关蛋白质的生物序列飞速增长。生物序列的海量产生、收集,造成已知蛋白质序列和已知蛋白质结构、功能之间的数量差距越来越大。开发具有一定智能、可以自动识别蛋白质结构、功能等生物信息的自动系统或模式识别方法成为了现实地、迫切地需求。基于机器学习和人工智能方法的蛋白质结构、功能预测一直是生物信息学研究的重点问题同时也是生物信息学面临的重大挑战。大量的文献报道和研究结果表明模式识别方法在蛋白质二级结构预测中取得了巨大的成功,同时产生了大量鲁棒性的方法,一些方法对蛋质二级结构地预测准确率可以达到75%以上。在高效、快捷地实验室蛋白质结构与功能测定技术出现前,通过综合应用计算机技术、数学方法和分子生物学理论从大量的蛋白质一级序列数据中获取蛋白质结构功能等生物意义是生物信息学的首要任务和重点研究对象之一。本文的主要工作就是从生物序列出发,应用支持向量机(SVM)和蛋白质序列融合表征方法进行蛋白质结构类预测研究。蛋白质结构类预测是蛋白质结构预测的一个重要组成部分,使得人们从大体上把握蛋白质的折叠情况成为现实。蛋白质结构类型预测可以对二级结构...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
最优分类面示意图
图 2.1 提取 CIF 文件中的蛋白质结构类数据蛋白质一级序列是由 20 种氨基酸组合构成的,分别用字母 A-T 表示不同种类酸的序列。表 2. 1 蛋白质结构类数据集
是 3 类样本,故需要训练 3 个分类器。如图 2.2 所示,3 类样本两两进+β 类蛋白质为正样本类,α 类蛋白质为负样本类;再令 α+β 类蛋白质为 类蛋白质为负样本类;再令 β 类蛋白质为正样本类,α 类蛋白质为负样one-against-rest)分解策略:在面对多分类问题时,将单个类别取出作为
【参考文献】:
期刊论文
[1]基于机器学习的凋亡蛋白的亚细胞位点预测[J]. 秦玉芳. 价值工程. 2012(30)
[2]药物靶蛋白结构域的特性研究[J]. 王晨曲,李冬果,李霞. 中国优生与遗传杂志. 2010(04)
[3]蛋白质组学的进展[J]. 李林,sunm.shcnc.ac.cn. 生物化学与生物物理进展. 2000(03)
[4]生物信息学[J]. 陈润生. 生物物理学报. 1999(01)
硕士论文
[1]半监督学习若干问题的研究[D]. 易星.清华大学 2004
本文编号:3282287
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
最优分类面示意图
图 2.1 提取 CIF 文件中的蛋白质结构类数据蛋白质一级序列是由 20 种氨基酸组合构成的,分别用字母 A-T 表示不同种类酸的序列。表 2. 1 蛋白质结构类数据集
是 3 类样本,故需要训练 3 个分类器。如图 2.2 所示,3 类样本两两进+β 类蛋白质为正样本类,α 类蛋白质为负样本类;再令 α+β 类蛋白质为 类蛋白质为负样本类;再令 β 类蛋白质为正样本类,α 类蛋白质为负样one-against-rest)分解策略:在面对多分类问题时,将单个类别取出作为
【参考文献】:
期刊论文
[1]基于机器学习的凋亡蛋白的亚细胞位点预测[J]. 秦玉芳. 价值工程. 2012(30)
[2]药物靶蛋白结构域的特性研究[J]. 王晨曲,李冬果,李霞. 中国优生与遗传杂志. 2010(04)
[3]蛋白质组学的进展[J]. 李林,sunm.shcnc.ac.cn. 生物化学与生物物理进展. 2000(03)
[4]生物信息学[J]. 陈润生. 生物物理学报. 1999(01)
硕士论文
[1]半监督学习若干问题的研究[D]. 易星.清华大学 2004
本文编号:3282287
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3282287.html