当前位置:主页 > 科技论文 > 自动化论文 >

基于扩增子测序数据的样本分类算法及其标志物发现研究

发布时间:2021-06-23 09:45
  肠道微生物是近年来一个研究热点,它与人类的健康和疾病息息相关。寻找疾病相关的微生物标志物,是人类在探索疾病道路上的一个重要方向。随着高通量测序地发展,越来越多在实验室不能培养出的微生物可以通过测序技术发现,肠道微生物组数据也爆发式地增长,这迫切需要研究或引入新的机器学习算法,以期发现相关疾病的微生物标志物。本文研究了基于肠道微生物数据的疾病分类机器学习算法,以此为基础,研究了用于微生物标志物发现的特征提取方法,并实现了一个微生物标志物数据库。本文主要包含如下工作:第一,引入LightGBM算法用于肠道微生物的疾病分类问题。对于疾病与肠道微生物关系问题,可以看成有监督的分类问题。本研究在基于微生物组的疾病分类问题中引入了 LightGBM这种较新的算法,并与深度森林、随机森林和支持向量机等几种在微生物组学数据中常用的方法进行比较,应用于10种疾病的肠道微生物数据。实验以微生物丰度数据作为算法的输入,以肠道微生物作为特征,样本患病与否作为输入的标签。实验系统地评估了四个算法在不同疾病之间的分类效果以及相同疾病不同数据集的分类效果。使用五折交叉验证,结果发现,LightGBM在多个数据集上都... 

【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校

【文章页数】:68 页

【学位级别】:硕士

【部分图文】:

基于扩增子测序数据的样本分类算法及其标志物发现研究


图1.2中首先采集患病样?

原理图,聚类,原理,生物标志物


类OTU。一般情况下,由扩??增子测序(即16SrRNA测序)得到的原始数据经过聚类方式处理后得到OTU丰度??数据,然后计算机学家再利用OTU丰度数据,来进行相关的计算等一系列操作。??non\?WW??我们97%相似,是男?我彳丨]97%相似,是女??孩子,是0TU1,有?孩子,是0TU2,有??三个成员?两个成员??:_??16S序列??相似度大于??▼?97%??c=)?CH)?〇ti,s??这些16S序列,基于序列间97%的相似性,聚成了3个OTU??图1.3?OTU的聚类原理??1.1.3生物标志物??生物标志物(Biomarker):?—种客观测量和评估的特征,可作为正常生物过程,??致病过程或对治疗干预的药理反应的指标|341。生物标志物也定义为:生物标志物可??以在体内或其产物中检测到的物质、结构或过程并且它可以影响(或预测)结果或??疾病地发生|351。从临床角度看,生物标志物对疑似疾病患者、有或无明显疾病患者??地护理有着重大影响。根据这一分类,生物标志物可分为诊断标志物、预后标志物??和筛选标志物。在基础和临床研宄以及临床实践中使用生物标志物己经变得非常普??遍。生物标志物在疾病中还有许多有价值地应用和监视健康状况,这些应用包括:??1、用作诊断工具,以识别患有疾病或异常状况的患者。2、用作疾病分期的工具或??疾病程度地分类。3、用作疾病预后的指标。4、用于预测和监测对干预措施的临床??反应I34]。因此找出疾病相对应的生物标志物,以便进行后续对治疗疾病的研宄是有??意义的。??本文将从生物数据库以及数据挖掘等角度筛选微生物标志物。这些生物标志物??旨在确定特定的操作分类

超平面,支持向量机


向量机??给定一个数据集{知%},%?e{0,l),i=l,2,...,n。假设该数据集线性可分,那么线??性可分支持向揿机就足寻找一个能够划分该数据集的超平面,并且使得两类样木中??距离超平面最近的样木点几何间隔最大化,此时找到的超平而为:??(w?_?x)?+?6?=?0?公式?3.1??其屮w,?h分別迠迎过该数椐集训练得到的权艰和偏差。超平而函数对应的决策函??数为:??=?sign((w?■?\)?+?b)?公式?3.2??在训练过程中的目的找到最优超平面。超平面如图3.1所示,假设数据集的特征维??度是二维的,并且是二分类问题,为了将蓝色圆形和绿色三角进行分类,支持向量??机寻找到了?LI,?L3两个平面之间的所有超平面,这些超平面都可以将所给的数据??集进行分类划分,然而L2超平面是寻找到的最优超平面??L3??酶??尤1??图3.1支持向量机的超平面??19??

【参考文献】:
期刊论文
[1]肠道菌群的检测方法及研究进展[J]. 刘玉婷,郝微微,温红珠,邵兰君.  世界华人消化杂志. 2016(20)



本文编号:3244715

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3244715.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3af8f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com