当前位置:主页 > 理工论文 > 生物学论文 >

智能计算在蛋白质分析中的若干应用研究

发布时间:2020-04-16 00:35
【摘要】:蛋白质是人体中每个细胞的重要组成成分,它是生命活动的主要执行者,调控着整个生命过程。蛋白质组测定和数据分析可以监测人体生理状态发生变化时蛋白质种类和数量的变化,帮助我们了解人体的机理和状态,具有很重要的意义。蛋白质除了在人体中发挥着重要的作用,还可以帮助化工、医疗以及制药等领域提高生成效率。但由于酶(蛋白质)本身的特性,它们一般都无法直接应用于体外复杂的化学体系中,这是因为酶可能出现不稳定或者反应条件苛刻等情况。目前改善酶的特性主要通过定向进化实现,而定向进化中的计算方法是提高定向进化生成蛋白质的效率与可用性的重要工具。本文主要从蛋白质组测定后的数据分析和定向进化中同源蛋白库的构建这两个方向所需的计算方法进行研究,主要的特色工作包括:(1)针对DIA(Data Independent Acquisition,数据非依赖性采集)数据的无目标分析提出了一种基于卷积神经网络的MSCNN(Mass Spectrometry Convolutional Neural Network,质谱卷积神经网络)预处理模型。该模型与DIA-Umpire中的模型相比,能充分利用肽段在MS1(First stage of Mass Spectrometry,一级质谱)和MS2(Second stage of Mass Spectrometry,二级质谱)中的特征,更有效的去除DIA数据中的噪声峰,对后续分析有显著的帮助。(2)针对RTF平台DIA数据的有目标分析中的预处理和蛋白质定量问题分别给出一种均匀提取预处理算法和提出了一种基于最小平方误差的蛋白质定量模型,并通过图谱的TIC(Total Intensity Current,总离子强度)图变化以及两个样品的相对浓度比分别证明了这两种方法的有效性。(3)针对同源蛋白库构建中的逆翻译过程给出一种多目标优化的解决方法。我们将逆翻译过程模型化为多目标问题,并用经典的多目标优化算法NSGA-Ⅱ解决,最后通过荧光蛋白亲本序列的模拟仿真实验证明了这种方法相对于常规的分段算法有很大的性能提升。
【图文】:

母离子,窗口大小,图谱,保留时间


方式容易造成低强度肽段的丢失,实验重复性较差。而DIA是在某个m/z邋(质荷逡逑比)范围内打碎所有母离子获取MS2,,并且顺序地覆盖整个相关的m/z范围,无逡逑歧视的获取所有肽段的信息(图2.2中灰色直线的长度为DIA采集的窗口大小,逡逑一次循环扫描结束使用的二级扫描个数为窗口个数,图中DIA采集方式的MSI逡逑扫描范围为400-1600m/z,进行了大约三次完整的循环采集,窗口大小为100m/z,逡逑窗口个数为10)。相对于DDA,DIA具有蛋白质覆盖率更高和重复性更好等优逡逑点,成为大规模和高质量蛋白质组测定的理想技术。逡逑DDW集方式逦DIA采集方式逡逑—^逦逦邋—88}3搐逡逑i逦车逡逑?逦二a扫播逦逦邋二级}3檐逡逑1600逦1600逡逑丨丨丨逡逑.邋.邋?邋丨!邋|丨邋丨1逡逑母离子庚荷比逦*逦.邋.逦.邋*.逦母离子质荷比逡逑(m/z)逦#逦?逦*逦(m/z)逡逑?逦?逦?逦III逡逑?逦‘逦丨丨丨I丨1邋I丨逡逑.逦500…I.邋丨.邋!'逦|逡逑400逦400...逡逑逦?邋逦?逡逑保留时间(Rentetlontime)逦保留时间(Remetlontime》逡逑图2.2邋DDA和DIA数据采集方式比较逡逑获取DIA数据后,对其无目标分析的主要流程如图2.3:先用同位素识别和逡逑去卷积算法对图谱中的峰进行分组和拆分以提取出峰[14_15】,然后使用预处理算逡逑法对图谱进行降噪[11],接着搜库软件使用图谱匹配算法将预测的蛋白质理论峰逡逑与提取的峰进行匹配以进行蛋白质的定性【18_21]

计算网络,真实值,网络结构,预测值


逦?逡逑保留时间(Retention邋time)逡逑图2.4邋MSI图谱示例逡逑卷积神经网络是一种深层前馈神经网络,具有局部连接、权重共享等特性,逡逑它是目前图像处理中最常用的一种模型[38_4(^。从DIA数据中提取出肽段的峰信逡逑号有三个维度的信息:质荷比、保留时间和峰强度。这种信号类似于图像中的逡逑像素点,像素点也是由三个维度的特征组成(行、列和强度),所以本章提出了逡逑MSCNN邋(Mass邋Spectrometry邋Convolutional邋Neural邋Network,质谱卷积神经网络),逡逑其网络结构如图2.5。MSCNN将提取出的肽段相关峰信号特征全部加入到神经逡逑网络中进行训练,能充分的利用肽段在MSI和MS2的特征,它提取MSI和MS2逡逑的特征的主要过程:先将图谱信息经过卷积层(Convolution)提取局部区域特征,逡逑而后将这些提取的特征输入到激活函数(Relu)中,这是因为激活函数可以弥补逡逑卷积层的线性模型表达力不够的缺点,然后利用池化层(Max邋Pool)进行特征压逡逑缩
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:Q51;TP18

【相似文献】

相关期刊论文 前10条

1 阿兰·格拉斯;许琪;;质疑历史方向论——对适应观念和定向进化观念的批判[J];国际社会科学杂志(中文版);2017年02期

2 陈丽芳;丁洁女;柳志强;郑裕国;;蛋白质定向进化及其在微生物代谢调控中的应用[J];基因组学与应用生物学;2012年01期

3 崔玉,杨军,孙萍,王全立;酶的体外定向进化策略研究进展[J];国外医学.遗传学分册;2005年05期

4 刘卫晓,钱世钧;酶分子体外定向进化的研究方法[J];微生物学通报;2004年02期

5 青云;;定向进化:驾驭进化的力量[J];科学24小时;2019年01期

6 孙博;王捷;;蛋白质分子体外定向进化研究进展[J];实用医学杂志;2006年11期

7 ;生物技术新热点──定向进化[J];国外科技动态;1999年08期

8 杨先碧;;走近诺贝尔奖(十八) 试管里的定向进化[J];大自然探索;2019年03期

9 杜文;王谦;王佳X;刘建新;;木聚糖酶基因的体外定向进化[J];动物营养学报;2013年10期

10 谢晚彬;谢和芳;;蛋白质定向进化的研究技术及应用[J];中国生物工程杂志;2005年S1期

相关会议论文 前10条

1 孔祥铎;;定向进化的方法提高来自大肠杆菌W的L-天冬氨酸酶的活性和稳定性[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(上册)[C];2001年

2 范树泉;赵晗;卢丽丽;肖敏;;定向进化技术提高α-半乳糖苷酶的转糖基效率[A];2008年中国微生物学会学术年会论文摘要集[C];2008年

3 姚清文;童春梅;林明晴;彭仁;;脂肪酶的分子改造[A];中国生物化学与分子生物学会2016年全国学术会议论文集[C];2016年

4 宋景娇;王友亮;金卫华;曹军卫;;定向进化方法提高BR分子光存贮性能的研究[A];湖北省生物工程学会2004年年会学术报告及论文摘要汇编[C];2004年

5 吴起;岑一欣;徐鉴;;Candida antarctica Lipase B的定向进化及其立体选择性调控[A];第十届全国化学生物学学术会议报告摘要集[C];2017年

6 杨怡然;唐兵;;嗜热蛋白酶WF146的体外定向进化[A];湖北省生物工程学会2004年年会学术报告及论文摘要汇编[C];2004年

7 武晓斌;杨克迁;;青霉素N脱乙酰氧基头孢菌素C合成酶(Deacetoxycephalosporin C Synthetase,DAOCS,扩环酶expandase)定向进化的研究[A];首届中国青年学者微生物遗传学学术研讨会论文摘要集[C];2002年

8 孙周通;;高效定向进化方法的开发与手性生物催化应用[A];第十一届中国酶工程学术研讨会论文摘要集[C];2017年

9 凌军;陆路;钟增涛;;天山根瘤菌菌植互作功能蛋白MsiA的定向进化[A];第十一届全国土壤微生物学术讨论会暨第六次全国土壤生物与生物化学学术研讨会第四届全国微生物肥料生产技术研讨会论文(摘要)集[C];2010年

10 沙冲;邵蔚蓝;左万兵;;酶基因克隆表达和定向进化技术的最新发展[A];2015中国酶工程与糖生物工程学术研讨会论文摘要集[C];2015年

相关重要报纸文章 前2条

1 郭晓强;“小作坊”为何能培养出诺奖?[N];中国科学报;2018年

2 记者 刘海英;快速定向进化技术几天即可“造出”新分子[N];科技日报;2019年

相关博士学位论文 前10条

1 徐鉴;定向进化调控酶的选择性及催化多功能性[D];浙江大学;2019年

2 柳志强;D-泛解酸内酯水解酶cDNA的克隆、表达与酶的定向进化[D];江南大学;2005年

3 陈炫;葡激酶体外定向进化的初步研究[D];中国人民解放军军事医学科学院;2004年

4 李红梅;细胞色素P450 BM-3体外定向进化及突变酶性能的研究[D];浙江大学;2006年

5 胡冬梅;抗体亲和力的体外定向进化及一种连续定向进化系统的搭建[D];中国科学技术大学;2015年

6 蔡永君;纳豆激酶的体外定向进化[D];武汉大学;2011年

7 周政;青霉素G酰化酶基因的基因工程和定向进化研究[D];中国科学院研究生院(上海生命科学研究院);2003年

8 郭继平;米曲霉碱性蛋白酶的异源表达和定向进化以及遗传改造[D];哈尔滨工业大学;2008年

9 李文杰;枯草芽孢杆菌尿酸氧化酶的定向进化[D];中国科学技术大学;2017年

10 毛淑蕊;热稳定性β-葡聚糖酶的克隆、表达及定向进化研究[D];南京农业大学;2013年

相关硕士学位论文 前10条

1 陈冲;智能计算在蛋白质分析中的若干应用研究[D];中国科学技术大学;2019年

2 刘晓冬;谷胱甘肽双功能合成酶的定向进化及酶法合成谷胱甘肽的研究[D];浙江大学;2018年

3 陈倩;科技创业企业定向进化及诱导因素研究[D];武汉理工大学;2012年

4 马全磊;枯草芽孢杆菌淀粉酶定向进化及对玉米粉水解效果的研究[D];石河子大学;2014年

5 陆英秀;Sulfolobus solfataricus P2中的(t)γ-内酰胺酶的半理性定向进化[D];北京化工大学;2016年

6 周向军;地衣芽孢杆菌α-淀粉酶定向进化研究[D];兰州大学;2006年

7 甄杰;新型普鲁兰酶的性质研究、定向进化及培养基优化[D];天津科技大学;2014年

8 袁卫生;水稻几丁质酶定向进化[D];广西民族大学;2013年

9 周娟;毕赤酵母体系木聚糖酶的定向进化及低聚木糖制备[D];南京林业大学;2012年

10 刘沛然;定向进化改造酪氨酸解氨酶强化大肠杆菌中对香豆酸的合成[D];江南大学;2015年



本文编号:2629180

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2629180.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b2ff1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com