某些肿瘤蛋白组质谱数据的分析模型及其应用
发布时间:2017-08-17 20:36
本文关键词:某些肿瘤蛋白组质谱数据的分析模型及其应用
更多相关文章: 蛋白质组 SELDI-TOF MS PseAAC 特征选择与提取 支持向量机
【摘要】:近年来,肿瘤已经严重威胁人类健康。寻找肿瘤的潜在生物标记对恶性肿瘤的早期诊断和治疗起到非常重要的作用。基于质谱技术的蛋白质组学数据分析能为肿瘤的早期诊断提供有力手段。从海量的肿瘤质谱数据中挖掘具有样本差异的标志物或者可以体现样本差异的特征,对恶性肿瘤标记物的识别具有重要的价值。本文在对肿瘤质谱的数据分析中,提出了一种从SELDI血清蛋白质中提取样本特征的方法。此方法具有较高的准确率、敏感性与特异性。具体工作如下: (1)从蛋白组学质谱原始数据中,采用重采样、基线校正、标准化、平滑、峰识别与提取、峰值对比等手段,提取到了具有较高可靠性的质谱峰值。 (2)提出了两种图形表示的方法,一种是将峰值转化为氨基酸序列,另外一种是将峰值转化为0-1序列。通过序列对比来提取代表样本差异的特征,并将特征看成肿瘤样本的标志物。 (3)根据样本特征,构建了样本二分类模型。本文将支持向量机运用到肿瘤标志物的分类器实现上,并对模型参数进行优化。与其他方法结果的比较,说明此方法具有较高的预测准确率。 (4)将上述预处理方法与模型应用到另一组三分类的卵巢癌质谱数据集上,将原来的二分类推广到多分类,得到了较好的结果。 本文的分析结果表明,,我们的方法具有很好的预测结果,并且适用于所有的质谱数据分析。
【关键词】:蛋白质组 SELDI-TOF MS PseAAC 特征选择与提取 支持向量机
【学位授予单位】:浙江理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R730.4
【目录】:
- 摘要4-5
- Abstract5-6
- 目录6-8
- 第一章 绪论8-12
- 1.1 本文的研究背景8-9
- 1.2 目前国内外的研究现状9-10
- 1.2.1 蛋白组质谱技术研究现状9
- 1.2.2 蛋白组质谱数据处理方法研究现状9-10
- 1.3 本文的主要研究工作10-12
- 第二章 蛋白质组学质谱数据的预处理12-23
- 2.1 蛋白质组学质谱数据12-14
- 2.1.1 质谱原始数据的介绍12-13
- 2.1.2 实验数据集13-14
- 2.2 蛋白质组学质谱数据的预处理技术14-18
- 2.2.1 质谱数据重采样15
- 2.2.2 质谱数据基线校正15-16
- 2.2.3 质谱数据的标准化16-17
- 2.2.4 质谱的谱线平滑17
- 2.2.5 峰值识别与提取17
- 2.2.6 谱图的峰值对比17-18
- 2.3 实验数据集的预处理18-22
- 2.4 本章小结22-23
- 第三章 蛋白质组质谱区间数据特征提取与选择23-32
- 3.1 蛋白质组质谱数据分析中的特征提取23-24
- 3.1.1 特征形成的概念23
- 3.1.2 特征提取的过程23-24
- 3.1.3 特征选择的判断标准及常用方法24
- 3.2 一种新的序列特征提取方法—PseAAC 方法24-25
- 3.3 PseAAC 方法在禽流感病毒 RNA 聚合酶上的应用25-31
- 3.3.1 禽流感病毒 RNA 聚合酶的简介25-26
- 3.3.2 RNA 聚合酶在转录过程中的作用机制26-31
- 3.4 本章小结31-32
- 第四章 恶性肿瘤质谱数据二分类模型构建及应用32-43
- 4.1 两种新的图形表示及数值刻画方法32-34
- 4.1.1 峰值转化为氨基酸序列32-33
- 4.1.2 峰值转化为 0-1 序列33-34
- 4.2 机器学习算法34-36
- 4.2.1 支持向量机34-35
- 4.2.2 分类性能评价35-36
- 4.3 模型构建与实验分析36-41
- 4.3.1 模型建立36-37
- 4.3.2 不同的归一化方法对模型性能的影响37
- 4.3.3 核函数对模型性能的影响37-38
- 4.3.4 模型的参数优化38-39
- 4.3.5 0-1 序列39-41
- 4.4 本章小结41-43
- 第五章 二分类模型的推广及其应用43-47
- 5.1 二分类情况43-45
- 5.2 多分类情况45-46
- 5.3 本章小结46-47
- 第六章 论文的总结和展望47-49
- 6.1 本文的主要工作小结47-48
- 6.2 将来工作的展望48-49
- 参考文献49-56
- 攻读硕士学位期间的研究成果56-57
- 致谢5
【参考文献】
中国期刊全文数据库 前4条
1 Kamel M A Hassanin;Ahmed S Abdel-Moneim;;Evolution of an avian H5N1 influenza A virus escape mutant[J];World Journal of Virology;2013年04期
2 董志伟,乔友林,李连弟,陈育德,王润田,雷通海,饶克勤,王汝宽,赵平,游伟程,鲁凤珠,戴旭东,王国清,罗贤懋,周海城;中国癌症控制策略研究报告[J];中国肿瘤;2002年05期
3 孟辉;洪文学;;蛋白质组学质谱数据预处理技术综述[J];中国生物医学工程学报;2009年03期
4 卢士英;邹明强;;食品中常见的非食用色素的危害与检测[J];中国仪器仪表;2009年08期
中国博士学位论文全文数据库 前1条
1 孟辉;基于图表达蛋白质组学质谱模式的癌症诊断可视化方法研究[D];燕山大学;2011年
本文编号:691003
本文链接:https://www.wllwen.com/yixuelunwen/zlx/691003.html
最近更新
教材专著