基于质谱筛选差异表达蛋白的统计学方法研究
本文关键词:基于质谱筛选差异表达蛋白的统计学方法研究,由笔耕文化传播整理发布。
【摘要】:准确、高效地筛选差异表达的蛋白质是基于质谱的定量蛋白质组学的重要研究内容之一,是发现生物标志物的先决条件,对疾病的早期诊断具有促进作用。但是差异分析方法较难选择、蛋白质定量信息缺失较多、筛选结果质量参差不齐等挑战一直存在于定量差异分析工作中。本文在前人的研究基础上,针对这些问题做了以下三个方面的工作:(i)在含有内标的真实蛋白质组学数据D1和D2上,评估了包含Welth检验、置换检验、ROTs、SAM和EBRCT法在内的五种有代表性的差异筛选统计方法,同时合理控制了检验结果的质量,通过比较ROC曲线、pAUC、TPR、FPR和FDR,证实了在D1和D2中,针对定量差异分析问题,结合经典统计理论与贝叶斯理论的统计方法和从其他组学借鉴的方法是不错的选择。(ii)根据蛋白质组学定量信息缺失的特点,在D1的基础上,模拟了九个含有不同缺失比例的数据,分别进行含有57种不同插补次数的链式等式多重插补,通过比较插补前后的绝对Pearson相关系数、平均MAD和平均MSD,可知多重插补的效果与插补次数和缺失比例相关,当缺失比例不变时,插补次数越多,插补效果不一定越好,且最优插补次数随着缺失比例的不同而不同。(iii)探讨了包含均值插补、基于丰度分布的插补、k近邻插补和多重插补在内的四种有代表性的插补方法对除EBRCT法之外的其它四种统计方法在筛选差异表达蛋白质方面检验功效的影响,通过比较ROC曲线、pAUC.f-score和g-score,以提醒相关研究人员在差异分析前,应慎重处理缺失数据。
【关键词】:质谱 定量蛋白质组学 差异表达 缺失值 统计方法
【学位授予单位】:大连海事大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O212.1
【目录】:
- 摘要5-6
- ABSTRACT6-10
- 第1章 绪论10-17
- 1.1 论文研究背景及意义10
- 1.2 国内外研究现状10-15
- 1.2.1 差异分析统计方法的选择问题11-12
- 1.2.2 定量结果中的缺失值问题12-13
- 1.2.3 差异分析结果的质量控制问题13-15
- 1.3 本文的主要工作15-17
- 第2章 相关概念及理论知识17-25
- 2.1 质谱17
- 2.2 定量蛋白质组学17-20
- 2.2.1 定量蛋白质组学的研究内容18
- 2.2.2 蛋白质组学的定量方法18-20
- 2.3 基于质谱的定量差异分析流程20
- 2.4 基于质谱的定量差异分析统计手段20-25
- 2.4.1 基于经典统计学派的差异分析统计方法21-22
- 2.4.2 基于贝叶斯学派的差异分析统计方法22
- 2.4.3 其他方法22-24
- 2.4.4 差异分析的软件工具24-25
- 第3章 差异分析统计方法的比较研究25-37
- 3.1 数据的来源及特点25-26
- 3.2 差异分析统计方法的原理与实现26-29
- 3.3 评价指标29-32
- 3.3.1 真阳与假阳、真阴与假阴29-30
- 3.3.2 灵敏度、特异性和准确性30-31
- 3.3.3 FPR和FDR31
- 3.3.4 ROC曲线和AUC值31-32
- 3.4 过程及结论32-37
- 第4章 插补方法对差异蛋白质筛选结果的影响37-49
- 4.1 数据的来源及特点37
- 4.2 插补方法的原理与实现37-39
- 4.3 评价指标39-41
- 4.3.1 绝对Pearson相关系数39-40
- 4.3.2 MAD和MSD40
- 4.3.3 g-score和f-score40-41
- 4.4 过程及结论41-49
- 结论与展望49-51
- 参考文献51-60
- 攻读学位期间公开发表论文60-61
- 致谢61
【相似文献】
中国期刊全文数据库 前10条
1 张时钊;;气象哨温度资料的插补[J];陕西气象;1981年08期
2 曹宗智;利用电子计算机实现水文资料的自动插补[J];干旱区地理;1987年04期
3 蒋勇敏,邱士安;无误差插补方法初探[J];机械;2000年S1期
4 乔丽华;傅德印;;缺失数据的多重插补方法[J];统计教育;2006年12期
5 杨伟东;朱红春;刘丽冰;;计算机数据课程中插补原理教学方法的探讨[J];实验室科学;2009年02期
6 屠其璞;一种气温场序列的延长插补方法[J];南京气象学院学报;1986年01期
7 黄蓉;胡泽勇;关婷;孙根厚;杨耀先;刘火霖;;藏北高原气温资料插补及其变化的初步分析[J];高原气象;2014年03期
8 庞新生;;分层随机抽样条件下缺失数据的多重插补方法[J];统计与信息论坛;2009年05期
9 杨军;赵宇;丁文兴;;抽样调查中缺失数据的插补方法[J];数理统计与管理;2008年05期
10 张岫云;按偏差最小原理进行插补的计算方法[J];上海机械学院学报;1980年02期
中国重要会议论文全文数据库 前5条
1 余予;李俊;任芝花;张志富;;标准序列法在日平均气温缺测数据插补中的应用[A];第八届全国优秀青年气象科技工作者学术研讨会论文汇编[C];2014年
2 吕强;;编写数控车、铣床加工多边形插补程序的方法[A];数控技术学术研讨会论文集[C];1999年
3 安金刚;;离线插补技术在运动控制中的应用[A];全国第十二届空间及运动体控制技术学术会议论文集[C];2006年
4 郑金兴;张铭钧;孟庆鑫;;变插补周期的数控进给速度控制算法研究[A];先进制造技术论坛暨第五届制造业自动化与信息化技术交流会论文集[C];2006年
5 谷永山;王锐;韦穗;;基于两幅视图的纵向插补方法[A];第十五届全国图象图形学学术会议论文集[C];2010年
中国博士学位论文全文数据库 前6条
1 叶伟;数控系统纳米插补及控制研究[D];北京交通大学;2010年
2 梅鹏;中国群死群伤火灾数据插补及快速损失评估研究[D];中国科学技术大学;2013年
3 孟书云;高精度开放式数控系统复杂曲线曲面插补关键技术研究[D];南京航空航天大学;2006年
4 刘巍;ARGO稀损数据插补与三维海洋要素场重构研究[D];西南交通大学;2012年
5 周勇;高速进给驱动系统动态特性分析及其运动控制研究[D];华中科技大学;2008年
6 郝永江;复杂参数曲线曲面加工控制与状态监测技术研究[D];天津大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘艳玲;调查数据无回答的插补方法及模拟比较[D];天津财经大学;2012年
2 余威;气象相似性网络构建及缺失气象要素数据的插补[D];西南大学;2015年
3 李玲雪;缺失偏态数据下异方差模型的统计推断[D];昆明理工大学;2015年
4 李永杰;基于PH曲线五轴数控插补策略的研究[D];辽宁科技大学;2015年
5 李静华;基于PMM插补法的线性回归模型系数估计量的模拟研究[D];天津财经大学;2015年
6 王锦霞;基于质谱筛选差异表达蛋白的统计学方法研究[D];大连海事大学;2016年
7 王伟;基于判别分析的多重插补影响因素研究[D];河北经贸大学;2015年
8 李圣瑜;调查数据缺失值的多重插补研究[D];河北经贸大学;2015年
9 王磊;Pythagorean Hodograph曲线及其插补技术的研究[D];山东大学;2009年
10 张万军;复杂曲线曲面插补技术修正算法的研究[D];兰州理工大学;2011年
本文关键词:基于质谱筛选差异表达蛋白的统计学方法研究,,由笔耕文化传播整理发布。
本文编号:342452
本文链接:https://www.wllwen.com/kejilunwen/yysx/342452.html