基于云平台的蛋白质组数据分析系统的构建
发布时间:2020-09-14 20:40
随着蛋白质组学实验仪器和技术方法的不断进步,蛋白质组学进入了大数据时代。蛋白质组学的大数据为解读生命奥秘,深入了解疾病机制,精准医疗提供了大量的数据和知识来源。然而伴随着蛋白质组学技术的高速发展,蛋白质组学产生的大数据对传统生物学实验室也带了新的挑战:在数据管理方面,目前尚缺乏一个标准化的元数据和数据管理平台;在数据处理方面,需要大量人力和计算能力来对数据进行处理;在数据分析方面,缺乏对应的生物信息学分析工具和数据挖掘工具。为了解决上述问题,本研究基于Galaxy工作流平台的框架建立了一个基于云平台的蛋白质组数据分析系统Firmiana。该系统主要由元数据管理模块、自动化数据处理模块、数据展示及分析模块以及数据挖掘模块组成。在数据管理方面,本研究根据HUPO-PSI制定的元数据标准,构建了实验元数据的收集模块;部署了高效、安全的原始数据收集模块;提供了多层次的数据备份及容灾系统,以保证蛋白质组学数据的数据安全。在数据处理方面,本研究基于Galaxy平台开发了自动化数据处理平台。自动化数据处理平台整合 了包括 ProteoWizard、The Trans-Proteomic Pipeline(TPP)等开源蛋白质组学分析框架和工具;同时本研究自主开发了多种定性定量软件,实现了工具的并行化优化。在数据分析方面,本研究基于浏览器/服务器模式架构,利用R和Python等主流编程语言构建了用户友好、操作简便的蛋白质组数据可视化和综合分析平台。平台能够可视化和交互性的对蛋白质组学数据进行展示和分析,同时支持多组学数据的联合分析。本系统部署了应用程序接口,以实现良好的扩展性和实用性。基于本系统收集的数据集,我们开发了对应的数据挖掘功能,构建了蛋白质互作网络。为了适应不断出现的新的蛋白质组学质谱方法,本研究在Firmiana开发了一系列的定性定量软件。本论文详细地介绍了超短动态排除周期的质谱方法。在该方法的基础上,本研究开发了定量算法,包含基于母离子和子离子离子流重构定量,子离子定量的强度加和定量等模块。将此算法应用与超短动态排除周期的质谱方法后,有效地提升了提高蛋白质组的定量准确度,证明了本系统的实用性和扩展性。基于云平台的蛋白质组数据分析系统的研究,将会更有力的推进蛋白质组学的发展,更有利地服务于精准医学和人类大健康。
【学位单位】:华东师范大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:TP393.09;Q51
【部分图文】:
图1-1常见的基于质谱的蛋白质组学分析方法逡逑者将样本中的蛋白质提取并分离纯化,然后通过酶解等方,再经过液相色谱等技术将肽段的混合物进一步按照物分离后的样品送入质谱中鉴定样品中肽段的构成,最后肽段匹配回蛋白质,以评估样本中的蛋白质组成。逡逑离技术逡逑质组样品的复杂性,即使用质谱方法进行分析,也存在题。为了实现高通量、快速的蛋白质组定性,定量分析,蛋白质样品分离技术。蛋白质样品分离技术分为蛋白质分
质谱技术的检测原理是通过测定质荷比(m/z)来鉴定出不同的离子的相对逡逑分子量《通常来说,质谱仪由进样系统、离子源、真空系统、检测器、质量分析逡逑器等五部分组成(图1-2)。其中离子化源和质量分析器是质谱中最重要的两个核逡逑心部件。逡逑■邋i邋十邋+逦Quadrupole邋Collsion邋Cell邋Mass^^yzer逡逑Inlet邋system逦H邋逦邋(TQF)逡逑(HPLC)逦|逦——邋CZ1邋Detector逡逑1邋nnn逦D邋n邋n邋0逦0邋In邋n邋n邋n邋n逡逑Ion邋sourece逡逑(ESI)逡逑r ̄^逦1邋i逦逦1邋i逦逦邋1逦/逡逑+逦1逦1邋i邋/逡逑Vacuum邋system逦\逦/逡逑图1-2串联质谱基本结构逡逑通常进样系统与高效液相色谱连接,负责将高效液相色谱中分离过的样品送逡逑入到质谱仪中。逡逑离子源的作用是将送入的样品进行离子化。在生物大分子分析质谱中,虫要逡逑有基质辅助激光解析电离质谱和电喷雾电离质谱两种。基质辅助激光解析电离是逡逑利用固体基质分子与样品分子分散混合,基质分子在激光的照射下吸收激光能量,逡逑并转变成基质的电子激发能,瞬间使固态基质蒸发转变成气态,样品分子解吸附逡逑发生电荷转移,使样品分子电离随之进入气相。电喷雾离子化是在离子蒸发”逡逑原理上发展起来的一种离子化方法,通过毛细管置于高H电场中将样品喷洒出去,逡逑由于流出的液体较少,在电场和辅助气的作用下,形成许多喷雾)K的带电荷微液逡逑滴。当液滴中的溶剂不断蒸发之后
统计分析工具。逡逑我们总结了上述15个蛋白质组学数据分析乎合的功能,并按照主要功能划逡逑分为H大块(图1-4):蓝色的部分表录看重于数据托管方面,黄色的部分着重于逡逑数据处理,而
本文编号:2818621
【学位单位】:华东师范大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:TP393.09;Q51
【部分图文】:
图1-1常见的基于质谱的蛋白质组学分析方法逡逑者将样本中的蛋白质提取并分离纯化,然后通过酶解等方,再经过液相色谱等技术将肽段的混合物进一步按照物分离后的样品送入质谱中鉴定样品中肽段的构成,最后肽段匹配回蛋白质,以评估样本中的蛋白质组成。逡逑离技术逡逑质组样品的复杂性,即使用质谱方法进行分析,也存在题。为了实现高通量、快速的蛋白质组定性,定量分析,蛋白质样品分离技术。蛋白质样品分离技术分为蛋白质分
质谱技术的检测原理是通过测定质荷比(m/z)来鉴定出不同的离子的相对逡逑分子量《通常来说,质谱仪由进样系统、离子源、真空系统、检测器、质量分析逡逑器等五部分组成(图1-2)。其中离子化源和质量分析器是质谱中最重要的两个核逡逑心部件。逡逑■邋i邋十邋+逦Quadrupole邋Collsion邋Cell邋Mass^^yzer逡逑Inlet邋system逦H邋逦邋(TQF)逡逑(HPLC)逦|逦——邋CZ1邋Detector逡逑1邋nnn逦D邋n邋n邋0逦0邋In邋n邋n邋n邋n逡逑Ion邋sourece逡逑(ESI)逡逑r ̄^逦1邋i逦逦1邋i逦逦邋1逦/逡逑+逦1逦1邋i邋/逡逑Vacuum邋system逦\逦/逡逑图1-2串联质谱基本结构逡逑通常进样系统与高效液相色谱连接,负责将高效液相色谱中分离过的样品送逡逑入到质谱仪中。逡逑离子源的作用是将送入的样品进行离子化。在生物大分子分析质谱中,虫要逡逑有基质辅助激光解析电离质谱和电喷雾电离质谱两种。基质辅助激光解析电离是逡逑利用固体基质分子与样品分子分散混合,基质分子在激光的照射下吸收激光能量,逡逑并转变成基质的电子激发能,瞬间使固态基质蒸发转变成气态,样品分子解吸附逡逑发生电荷转移,使样品分子电离随之进入气相。电喷雾离子化是在离子蒸发”逡逑原理上发展起来的一种离子化方法,通过毛细管置于高H电场中将样品喷洒出去,逡逑由于流出的液体较少,在电场和辅助气的作用下,形成许多喷雾)K的带电荷微液逡逑滴。当液滴中的溶剂不断蒸发之后
统计分析工具。逡逑我们总结了上述15个蛋白质组学数据分析乎合的功能,并按照主要功能划逡逑分为H大块(图1-4):蓝色的部分表录看重于数据托管方面,黄色的部分着重于逡逑数据处理,而
本文编号:2818621
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2818621.html