基于概率话题模型的微生物菌群结构研究
发布时间:2018-02-10 00:42
本文关键词: LDA模型 Gibbs抽样 蒙特卡洛算法 系统聚类 K-Means聚类 出处:《中国科学:生命科学》2017年11期 论文类型:期刊论文
【摘要】:微生物菌群结构的异质性在影响宿主健康与疾病等方面有着十分重要的作用.对于菌群结构的时间与空间尺度异质性研究主要有非监督学习算法以及监督学习算法.由于菌群数据特性与文本数据特性之间的相似性,本文采用非监督学习的LDA概率话题模型对菌群结构的时间异质性进行研究,并与系统聚类和K-Means聚类这两种方法进行比较.采用LDA模型折叠Gibbs抽样的蒙特卡洛算法对两种数据源北平顶猴(Macaca leonina)阴道菌群(MVB)和轻微型肝性脑病(MHE)菌群的时间异质性OTUs数据集进行了分析.用LDA模型分别将MVB和MHE数据源中的27个样本和77个样本的OTUs数据集分为6个Topic和4个Topic.这与系统聚类和K-Means聚类划分成的簇数目(分别为5,3与4,3)有所不同.此外,实验表明结合MVB样本间生理数据-pH和MHE中样本α多样性,pH和α值的分类相似性更能与LDA模型的样本分类特性保持一致.因此,LDA在样本的聚集程度上更能精确地对OTUs数据集进行分类.更为重要的是,LDA模型还可以鉴定出每个Topic中具有代表性的OTUs.与系统聚类和K-Means聚类方法相比较,LDA模型不仅能更为有效地量化菌群结构的异质性,还能鉴定出相对应影响异质性的OTUs.
[Abstract]:The heterogeneity of microbial community structure plays an important role in affecting host health and disease. There are mainly unsupervised learning algorithms and supervised learning algorithms for the study of temporal and spatial scale heterogeneity of microbial structure. Because of the similarity between the characteristics of microflora data and text data, LDA probabilistic topic model based on unsupervised learning was used to study the temporal heterogeneity of microbial structure. And compared with the two methods of systematic clustering and K-Means clustering. Using the Monte Carlo algorithm of folding Gibbs sampling with LDA model, the time heterogeneity of the two data sources (Macaca leonina) vaginal flora (MVBB) and mild hepatic encephalopathy (MHEs) were studied in two kinds of data sources: Macaca leonina). The OTUs data sets of 27 samples and 77 samples from MVB and MHE data sources were divided into 6 Topic and 4 Topics by using LDA model. This was compared with the number of clusters divided into systematic clustering and K-Means clustering. In addition, The experimental results show that the similarity of 伪 -diversity pH and 伪 -values of samples in MVB can be more consistent with the classification characteristics of LDA model. The OTUs data sets are classified. More importantly, the representative OTUs in each Topic can be identified. Compared with the systematic clustering and K-Means clustering methods, the LDA model can not only quantify the heterogeneity of the flora structure more effectively. OTUs, which influence heterogeneity, can also be identified.
【作者单位】: 昆明理工大学信息工程与自动化学院;昆明理工大学附属医院云南省第一人民医院消化科;昆明市延安医院昆明医科大学附属延安医院急诊科;
【基金】:国家自然科学基金(批准号:81260077,81560107,11265007)资助
【分类号】:R37;TP311.13
【相似文献】
相关期刊论文 前7条
1 管正秀;人体正常微生物菌群及其作用[J];生物学教学;1999年01期
2 孙笑非;潘宝海;孙冬岩;;动物微生物菌群基因组的研究方法[J];饲料研究;2013年12期
3 李万坤;郭福存;赵兴绪;Williams B A;Kwakkel R P;Verstegen M W A;;多糖和寡糖的体外发酵特性及其对鸡盲肠微生物菌群的影响[J];动物营养学报;2007年03期
4 范玉贞;;衡水湖微生物菌群分布的研究[J];衡水学院学报;2009年04期
5 成玉梅;邓卫东;毛华明;;实时荧光定量PCR技术在研究反刍动物消化道微生物菌群生态学上的运用[J];饲料博览;2006年11期
6 ;名词解析——EM[J];水产学报;2006年04期
7 于超;郭海勇;吴同磊;王建;钱爱东;;山羊胚胎胃肠道细菌的分离与鉴定[J];吉林农业大学学报;2013年01期
相关博士学位论文 前1条
1 郭嫣秋;瘤胃产甲烷菌定量检测与微生物菌群调控研究[D];浙江大学;2008年
相关硕士学位论文 前2条
1 刘杰;连作及轮作土壤微生物菌群对黄瓜生长的影响[D];东北农业大学;2015年
2 朱艳艳;光合生物制氢过程中微生物菌群特性研究[D];河南农业大学;2013年
,本文编号:1499252
本文链接:https://www.wllwen.com/xiyixuelunwen/1499252.html
最近更新
教材专著