细胞因子和miRNA识别研究

发布时间:2017-12-20 05:02

  本文关键词:细胞因子和miRNA识别研究 出处:《河北工程大学》2017年硕士论文 论文类型:学位论文


  更多相关文章: miRNA 细胞因子 BP神经网络 libSVM_Fscore 模式识别 机器学习 特征提取


【摘要】:近年来,伴随着蛋白质序列提取技术的发展,蛋白质序列的数量迅猛增长。由于大量的研究证明,特殊蛋白质有很重要的生物学功能,和众多人类疾病有着密切的联系。为了从大规模的数据集中识别出特殊功能的蛋白质序列,计算机技术的方法在特殊蛋白质结构识别中得到广泛应用,尤其是基于机器学习的计算方法被众多研究人员进行研究。当前关于特殊蛋白质识别的机器学习方法仍然存在着很多精度提升的空间。本论文从以下两个方面提高特殊蛋白质识别精度:(1)特征提取;(2)分类器的选择。特征提取方面,将多种性能较好的特征集进行结合,提出并使用降维方法——MRMD(MaxRelevanceMaxDistance)选择更优秀的特征集,通过对比实验结果,对MRMD的性能进行分析。分类器选择方面,本论文将对BP神经网络(back propagationneural network,BP-NN)和支持向量机(Support Vector Machine,SVM)的参数进行优化,将优化之后的分类器作用于特殊蛋白质的识别,并且多种性能优秀的分类器被选择作为对比,分析优化后的分类器的性能。在miRNA识别方面,通过对比分析实验结果发现,使用优化之后的BP-NN的方法,结合从miRNA序列中提取的98维特征集对miRNA进行识别,精度和召回率分别为96.00%和96.67%,比其它分类器的精度最高提高13.64%。在细胞因子识别部分,一方面综合144次实验的结果发现,使用MRMD降维之后的特征集,在细胞因子识别方面拥有较高性能。另一方面结合性能较好的2种分类器和3种特征集,综合分析后发现,在细胞因子识别方面,性能表现最好的三种组合为473D+libSVM_Fscore、MRMD+libD3C、PCA+libSVM_Fscore。
【学位授予单位】:河北工程大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:Q78

【参考文献】

中国期刊全文数据库 前1条

1 郝红卫;王志彬;殷绪成;陈志强;;分类器的动态选择与循环集成方法[J];自动化学报;2011年11期



本文编号:1310823

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/1310823.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户463d7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com