基于蛋白质序列的表示学习和最适条件分析
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP181;Q51
【图文】:
逦" ̄?? ̄邋\逡逑图2-1序列表示学习模型及应用框架逡逑氨基酸和序列位点向量的学习流程和应用场景框架如图2-1所示。框架图的逡逑左上部分是氨基酸和序列位点向量的学习部分。其中,黑色箭头表示数据处理过逡逑程和基于两个优化目标的模型训练过程。右下部分为向量应用的四个示例,由红逡逑色箭头表示,即:1)预测序列的最适条件。2)比较同一家族两个序列的最适条逡逑件。3)寻找保守区和非保守区。4)对野生型蛋白给出突变建议。其中,灰色箭逡逑头表示数据流。逡逑2.2面向最适条件的氨基酸和序列位点向量的表示学习逡逑氨基酸序列的最适条件受两个因素影响,一是氨基酸序列由何种氨基酸组成,逡逑二是氨基酸在序列中是如何排布的。由此,引入两个目标函数来了解最适条件与逡逑氨基酸序列之间的关系:1)单个位点上氨基酸种类对最适条件的影响。2)不同逡逑位点的氨基酸相互作用共同对最适条件产生影响。第一个目标用于确定何种氨基逡逑酸在序列的哪个位置上会影响酶的最适条件,而第二个目标用于确定影响酶最适逡逑条件的非保守区域。本文提出了一种表示学习方法将两个目标结合在一起。通过逡逑对联合目标的学习
2.3.3数据预处理逡逑根据预期条件将训练集分成心和&两个数据集,其中&中氨基酸序列的最适逡逑pH更接近预期条件。例如:预期条件是耐碱性,则把最适PH高于7的氨基酸逡逑序列划入心集合中,将最适pH小于等于7的氨基酸序列划入集合中。按照以逡逑下三步生成样木:逡逑(1邋)从心中随机选择一条氨基酸序列a,从&中随机选择一条氨基酸序列L逡逑(2)比较这两条氨基酸序列每个位点的元素,随机选择一个差异位点逡逑(3)将(fc,a)放入正样本集合中,将(fcj)放入负样本集合中。逡逑重复上述三步N次生成正样本集和负样本集。在训练位点和氨基酸的向量逡逑时,随机从正负样本集中随机抽取一个或多个正负样本进行训练。逡逑2.4表示向置的语义分析逡逑
量化了序列最适pH是否高于或低于期望条件的不确定性,如公式(19)所示。逡逑H(y)邋=邋-Ssi=Si,shpC^)邋?邋l0gp(Si)逦(19)逡逑其中,然后,量化当确定一个位点的氨基酸时能够多大程度的减少这逡逑I尸I逡逑种不确定性。对于给定位点/c,条件熵//(y|cfc)量化了当己知该位点的氨基酸为cfc逡逑时最适邋pH邋的不确定性,即:.邋Z05PCS"i|cfc)。位点fc逡逑的条件熵为=ECfce』^^H(y|Cfc),其中表示第fc个位点上是氨基酸&逡逑的序列集合。最后,通过公式Gain(/c)邋=邋H(y)邋-邋//(y|/c)计算氨基酸序列第々个位逡逑点的信息增益。以散点图的形式展示GH11家族氨基酸序列集合每个位点的信息逡逑增益。如图2-3所示,横坐标表示对齐序列上的位点,纵坐标表示位点的信息增逡逑益。逡逑
【相似文献】
相关期刊论文 前10条
1 周勤;实验设计与分析中确定最适条件的统计试验实现方法[J];山东建材学院学报;1998年01期
2 王爱华,靳亚平,武浩;猪PBMC产生IL-2最适条件的探讨[J];西北农业学报;2000年03期
3 郑健;郭守华;宋瑜;郑勇奇;杨晓燕;苑林;;臭椿种子萌发最适条件研究[J];西北植物学报;2007年05期
4 魏杰;候萧;李辉;刘宏生;;产谷氨酰胺合成酶发酵条件的研究[J];辽宁大学学报(自然科学版);2006年03期
5 王珊,金先庆,杨纯正,齐静;探讨MDR1基因转染k562细胞的最适条件[J];中华小儿外科杂志;2002年06期
6 孙芸;毛彩霞;景崤壁;;探究铜和浓硫酸反应的最适条件[J];中学生数理化(学习研究);2016年10期
7 张霞,张利;液态高温糖化——固态酒化醋化工艺生产优质香醋[J];中国调味品;2002年10期
8 艾斯卡尔·依米提,哈木拉提·吾甫尔,伊力哈木江·沙比提;AP-RCR方法进行基因多态性分析时最佳反应条件的构建[J];新疆医科大学学报;2000年03期
9 孙燕;洪青;李顺鹏;;一株生物表面活性剂产生菌的分离及其特性研究[J];微生物学通报;2009年08期
10 邹粮泽;李乐;吴贵富;张敏;金英海;;乳酸菌发酵米糠富锗条件的筛选[J];吉林畜牧兽医;2017年09期
相关会议论文 前1条
1 黄燕华;冯定远;;不同来源纤维素酶的酶活最适条件研究[A];酶制剂在饲料工业中的应用[C];2005年
相关博士学位论文 前1条
1 陈朋;氧化亚铁硫杆菌生物浸出雄黄系统研究[D];兰州大学;2011年
相关硕士学位论文 前2条
1 李相君;基于蛋白质序列的表示学习和最适条件分析[D];山东大学;2019年
2 王迪;消化法检验旋毛虫最适条件的筛选[D];吉林大学;2014年
本文编号:2757798
本文链接:https://www.wllwen.com/projectlw/swxlw/2757798.html