基于代价敏感学习的SUMO蛋白质修饰位点预测的研究

发布时间:2021-11-09 04:54
  随着科学技术的爆炸式发展,人类在很多领域都获得了不小的进步。人类基因组计划的实施以及下一代基因测序技术的成熟也产生了海量的生物数据。如何利用最新的技术挖掘数据背后的生物信息,对于生物学的长足发展具有重要意义。翻译后修饰是一类通过改变蛋白质原始化学组成成分的调节过程。它通过在一个或者多个氨基酸残基上添加修饰的基因组(例如磷酸酯,糖基,泛素和脂肪酰基)来调节蛋白质功能和细胞过程。小泛素修饰(SUMO)是翻译后修饰中非常独特和重要的一种,主要通过改变细胞内定位或其他类型的翻译后修饰来调节底物功能。SUMO蛋白是泛素类蛋白家族的重要成员之一,可影响蛋白质的稳定性,酶活性以及蛋白质相互作用。鉴定原核生物或真核生物中的SUMO蛋白修饰位点是十分重要的,可以帮助我们更好地了解各种疾病的发病机制,如癌症和阿尔茨海默氏病。数据不平衡现象在生物信息学中十分常见,正样本的数量远小于负样本的数量,在SUMO蛋白修饰位点预测的研究中中也存在这一现象。并且机器学习算法很容易受到数据不平衡的影响,尽管已开发出多种预测SUMO蛋白修饰位点的计算方法,但它们在不平衡数据集上的表现不佳,正样本的识别率都偏低。本文首先分析... 

【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:70 页

【学位级别】:硕士

【部分图文】:

基于代价敏感学习的SUMO蛋白质修饰位点预测的研究


切割蛋白质序列

卷积,神经网络,卷积核


华东师范大学硕士学位论文45图6-1卷积神经网络在CPU和GPU中不同层的时间分布卷积操作是指将每个卷积核与图像中与卷积核大小相同的局部图像对应的像素点的值进行乘法加法的操作。特征图是指卷积核依次滑过图像每个位置得到的结果图,卷积核可以有多个不同的尺寸,如3x3,5x5。操作过程如图6-2所示:120553210323503520151332141205320441213135200231210110232023特征图(7*7)卷积核(3*3)结果图(5*5)图6-2卷积操作CNN中的卷积层包含三个参数:1)深度depth,表示通道数,也是卷积核的数量;2)步长stride,表示卷积核在原始图像上每次移动的步数;3)零填充zero-padding,表示是否需要在原始图像的边缘用0来填充,数值代表填充的圈数。


本文编号:3484664

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3484664.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户59281***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com