当前位置:主页 > 科技论文 > 自动化论文 >

基于数据的蛋白质功能预测研究

发布时间:2021-07-02 11:57
  蛋白质是生命活动的物质基础,对其功能的预测至关重要。目前主要有两种方法测定蛋白质功能:生物实验方法和基于数据的计算方法。生物实验法存在耗时长,成本高的问题,因此基于数据的方法是目前对蛋白质功能预测的研究热点。本课题使用基于数据的方法对蛋白质功能进行预测,研究内容主要包括以下三个方面:(1)构筑基于结构域和改进MIMLSVM的蛋白质功能预测模型。针对现有MIML算法预测精度不高的问题,设计一种基于改进MIMLSVM预测蛋白质功能模型。首先,采用改进的Hausdorff方法计算包之间的空间距离,并结合K-Medoids方法将MIML(多示例多标签)问题退化为多标签问题,以提高预测精度;然后,利用SVM算法将多标签问题转化为多个独立的二分类问题,结合蛋白质数据的特点,建立蛋白质功能预测模型,并利用粒子群算法优化模型参数;最后,通过对七种生物蛋白质功能预测的实验,证明所建模型的优越性。(2)设计基于AVC-SVM的芋螺毒素离子通道类型预测模型。针对现有方法对离子通道预测中存在的信息冗余问题,设计一种基于AVC(Analysis of Variance and Correlation)和SVM的... 

【文章来源】:河南师范大学河南省

【文章页数】:61 页

【学位级别】:硕士

【部分图文】:

基于数据的蛋白质功能预测研究


蛋白质功能预测流程图

学习模型,标签,示例


IML 算法简介传统的监督学习中,一个样本对应一个示例(instance),即一个特征向量将有助类标签。而在很多情况下,需要用一个示例集合去表达一个复杂的对象。例如网页中可以提取多个链接,每个链接用一个示例表示。因此,与传统的学习框MIML 学习模型能够更方便自然地处理复杂对象[12,13]。对于一个由许多不同的混合在一起复杂概念的标签,直接学习这个概念可能是相当困难的。因此可以个标签转换成一组对应于一些子概念的标签的方式,使得机器学习的过程更加易。

蛋白质功能,模型,算法,示例


Yj是负类样本。的 MIMLSVM 算法预测蛋白质功能的模型型建立在 MIMLSVM 算法的基础上进行改进,改进的 MIMLSVM 模型对蛋白要过程为:,使用改进的 Hausdorff 距离计算每两个示例包之间的空间距离,s 算法的思想将示例包聚为 k 类,MIML 问题退化为多标签问题;其 算法将多标签问题转化为多个二分类问题,逐一进行求解。最后,使得到的模型对蛋白质功能进行预测。改进的 MIMLSVM 算法对蛋白质流程如下图 3-1 所示。

【参考文献】:
期刊论文
[1]基于改进的MIMLSVM预测蛋白质功能[J]. 王鲜芳,王俊美,王晓雷,张悦.  信阳师范学院学报(自然科学版). 2017(04)
[2]Ion Channel Genes and Epilepsy:Functional Alteration,Pathogenic Potential,and Mechanism of Epilepsy[J]. Feng Wei,Li-Min Yan,Tao Su,Na He,Zhi-Jian Lin,Jie Wang,Yi-Wu Shi,Yong-Hong Yi,Wei-Ping Liao.  Neuroscience Bulletin. 2017(04)
[3]蛋白质结构预测[J]. 邓海游,贾亚,张阳.  物理学报. 2016(17)
[4]Local Sequence Information-based Support Vector Machine to Classify Voltage-gated Potassium Channels[J]. Li-Xia LIU Meng-Long LI Fu-Yuan TAN Min-Chun LU Ke-Long WANG Yan-Zhi GUO Zhi-Ning WEN Lin JIANG College of Chemistry,Sichuan University.Chengdu 610064,China.  Acta Biochimica et Biophysica Sinica. 2006(06)
[5]高通量蛋白质组学研究中一种基于GO的蛋白质功能分析策略(英文)[J]. 李栋,荔建琦,欧阳曙光,吴松锋,王建,徐筱杰,朱云平,贺福初.  生物化学与生物物理进展. 2005(11)
[6]生物信息学在蛋白质结构与功能预测中的应用[J]. 徐建华,朱家勇.  医学分子生物学杂志. 2005(03)
[7]基于Relief的组合式特征选择[J]. 张丽新,王家廞,赵雁南,杨泽红.  复旦学报(自然科学版). 2004(05)

博士论文
[1]基于数据挖掘技术的蛋白质功能预测研究[D]. 孙承磊.上海大学 2013

硕士论文
[1]基于多数据源融合的蛋白质功能预测方法研究[D]. 张信.大连理工大学 2015
[2]分枝杆菌蛋白质亚细胞定位的预测研究[D]. 丁辰.电子科技大学 2013
[3]基于特征筛选方法预测不同离子通道活性的芋螺毒素[D]. 袁鲁峰.电子科技大学 2013



本文编号:3260420

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3260420.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c9e46***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com