当前位置:主页 > 医学论文 > 生物医学论文 >

代谢组学数据挖掘关键问题研究

发布时间:2021-04-08 01:23
  代谢组学是上世纪七八十年代发展起来的一门科学,是继基因组学、转录组学、蛋白质组学之后诞生的一门新的交叉学科,也是系统生物学中的一个重要组成部分,近年来已经迅速成为生命科学研究的热点之一。与各种组学类似,代谢组学也是一门融合分析化学、化学计量学以及生理病理学等领域知识的交叉学科。完整的代谢组学研究过程包括样品的采集、预处理、数据的采集和数据的分析及解释等步骤。研究平台主要由分析技术平台和数据分析平台构成。数据分析是代谢组学研究的重要组成部分,也是揭示生物规律的关键步骤。分析技术精密性的提高,各种分析平台视窗的扩大,批量生物样本检测需求都大大增加了输出数据的量和复杂度,给后续分析和挖掘带来了极大的负担。本论文就代谢组学数据挖掘领域的几个关键问题进行研究讨论,主要内容如下:1、基于MATLAB平台,将四种分类器,偏最小二乘(Partial LeastSquares regression,PLS),线性判别式分析(Linear discriminantanalysis,LDA),支持向量机(Support vector machines,SVM)以及随机森林(Random forest,RF)... 

【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:75 页

【学位级别】:硕士

【部分图文】:

代谢组学数据挖掘关键问题研究


代谢组学研究流程图

原理图,原理,类别,决策组


图 2- 1 SVM 原理 意图Fig.2-1 SVM principle diagramF)RF,Leo Breiman 2001)在机器学习中分类器,并且其输出的类别是由个别树型原理前需要了解另外两个内容:决策组合而成,每个决策树都参与当前分类分类方法,是以实例(又称为训练集)为来,在机器学习、知识发现等领域得到了点表示在一个变量上的测试,每个分支类别[51]。p aggregating)算法[52]是由 Leo Breiman

谱图,谱图,数据,代谢组学


代谢组学数据挖掘关键问题研究 第二章 典型机器学习算法在代谢组学数据分析中的应用和比较2.4.1.2. GC-MS 检测所有的尿液(CRC)和血清(LC)样本首先经过化学衍生化,随后由 GC-MS和 GC-TOFMS 尽行分析。具体操作参考文献[22]。图 2- 2 为两个数据集的总离子图(Total Ion Current,TIC),A 为肠癌病人尿液,检测仪器为 GC-QMS(GasChromatography Quadrupol Mass),B 为肝癌病人血清样本,检测仪器为GC-TOFMS。

【参考文献】:
期刊论文
[1]基于SVM-RFE-SFS的基因选择方法[J]. 游伟,李树涛,谭明奎.  中国生物医学工程学报. 2010(01)
[2]钩藤多动合剂的药效作用及用代谢物组学方法研究其生化机制[J]. 黄玉荣,魏广力,龙红,肖淑华,王淑芳,刘昌孝.  中草药. 2005(03)
[3]数据挖掘分类算法综述[J]. 谈恒贵,王文杰,李游华.  微型机与应用. 2005(02)
[4]数据挖掘中决策树算法的探讨[J]. 唐华松,姚耀文.  计算机应用研究. 2001(08)

硕士论文
[1]随机森林及其在色谱指纹中的应用研究[D]. 孙烈.大连理工大学 2009



本文编号:3124575

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/swyx/3124575.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户93b8a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com