基于16S rRNA序列可变区的微生物物种鉴定及分析
发布时间:2021-10-25 17:02
微生物在这个世界上无处不在(肠道、口腔、食品、空气中等),鉴定微生物物种对更好地分析海洋、土壤、大气等环境中的微生物及改善人们的身体健康有重要的意义。16S rRNA基因是对原核微生物进行系统化分类研究时最常用的分子标志物,基于16S rRNA序列鉴定微生物物种的目标是将未知物种序列分类到界、门、纲、目、科、属等级,鉴定方式有两种:基于同源性分析鉴定微生物物种和基于机器学习算法鉴定微生物物种。本文提出了一种基于机器学习算法鉴定微生物物种的方法。由于16S rRNA序列包含的属种类超过2000种,因此该分类问题是一个典型的超多类问题。本课题提出以神经网络算法为模型,采用引物对的方式提取16S rRNA序列的可变区并用于物种鉴定模型的训练,使得模型可以根据16S rRNA序列的可变区实现物种鉴定。针对transetNo16数据集和Greengenes数据集各自的序列标签完整性,我们提出了基于标签完整数据的物种鉴定和基于标签不完整数据的物种鉴定两种方案,最后集成这两种方案实现基于16S rRNA序列可变区的微生物物种鉴定。第一种方案利用标签之间的隶属关系采用了层次化分类器,先将序列分类到门水...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
RDP数据库中的16SrRNA序列统计分布图
算法表现最好。综上所述,Adam 算法在本实验中的 V2 数据中表现最为优异,因此在之后的各个可变区所在网络中均采用 Adam 梯度下降算法。图3.1 不同梯度下降算法对层次化 CNN 模型的性能影响图图3.2 不同梯度下降算法对层次化 MLP 模型的性能影响图
在之后的各个可变区所在网络中均采用 Adam 梯度下降算法。图3.1 不同梯度下降算法对层次化 CNN 模型的性能影响图图3.2 不同梯度下降算法对层次化 MLP 模型的性能影响图
【参考文献】:
期刊论文
[1]基于16S rRNA基因序列分析的物种辅助分类研究与实现[J]. 任清福,孙清岚,马俊才. 科研信息化技术与应用. 2015(05)
[2]一种确定神经网络隐层节点数的新方法[J]. 张清良,李先明. 吉首大学学报(自然科学版). 2002(01)
本文编号:3457825
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
RDP数据库中的16SrRNA序列统计分布图
算法表现最好。综上所述,Adam 算法在本实验中的 V2 数据中表现最为优异,因此在之后的各个可变区所在网络中均采用 Adam 梯度下降算法。图3.1 不同梯度下降算法对层次化 CNN 模型的性能影响图图3.2 不同梯度下降算法对层次化 MLP 模型的性能影响图
在之后的各个可变区所在网络中均采用 Adam 梯度下降算法。图3.1 不同梯度下降算法对层次化 CNN 模型的性能影响图图3.2 不同梯度下降算法对层次化 MLP 模型的性能影响图
【参考文献】:
期刊论文
[1]基于16S rRNA基因序列分析的物种辅助分类研究与实现[J]. 任清福,孙清岚,马俊才. 科研信息化技术与应用. 2015(05)
[2]一种确定神经网络隐层节点数的新方法[J]. 张清良,李先明. 吉首大学学报(自然科学版). 2002(01)
本文编号:3457825
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3457825.html