KPCA在痤疮宏基因组数据辅助分析中的应用
发布时间:2021-02-18 01:58
痤疮作为一种常见的皮肤病,发病率逐年增加。尝试使用机器学习方法分析痤疮宏基因组测序数据。使用主成分分析(Principal Component Analysis,PCA)和核主成分分析(Kernel Principal Component Analysis,KPCA)方法分别分析痤疮患者的患病皮肤(Diseased Skin,DS)样本集和健康皮肤(Healthy Skin,HS)样本集,以及正常对照(Normal Control,NC)样本集,获得对各自样本集具有显著影响的脂质。实验结果表明,KPCA方法可以得到比PCA更丰富的信息,并且得到仅对某一样本集有显著影响的脂质可以作为判别皮肤状态的指标。
【文章来源】:计算机仿真. 2020,37(11)北大核心
【文章页数】:4 页
【部分图文】:
PCA和KPCA累计贡献率为95%时实验结果
表1 图1和图2中脂质编号的具体描述 编号 描述 608 PC(20:0/26:0) 776 PC(34:0/16:0) 1061 Tacrolimus 1205 1-(6-[5]-ladderane-hexanoyl)-2-(8-[3]-ladderane-octanyl)-sn-glycerophosphocholine 1236 1-(8-[3]-ladderane-octanoyl)-2-(8-[3]-ladderane-octanyl)-sn-glycerophosphoethanolamine 1240 PS(22:6(4Z,7Z,10Z,13Z,16Z,19Z)/18:1(9Z)) 1244 PS(20:5(5Z,8Z,11Z,14Z,17Z)/20:0) 1245 1-(8-[3]-ladderane-octanoyl)-2-(8-[3]-ladderane-octanyl)-sn-glycerophosphoethanolamine 1264 PS(22:6(4Z,7Z,10Z,13Z,16Z,19Z)/19:1(9Z)) 1266 1-(6-[3]-ladderane-hexanoyl)-2-(8-[3]-ladderane-octanyl)-sn-glycerophosphocholine 1279 1-(6-[3]-ladderane-hexanoyl)-2-(8-[3]-ladderane-octanyl)-sn-glycerophosphocholine 1283 PS(18:4(6Z,9Z,12Z,15Z)/22:0) 1302 PS(20:3(8Z,11Z,14Z)/19:0) 1304 (3"-sulfo)Galbeta-Cer(d18:0/18:0(2OH)) 1311 PS(22:6(4Z,7Z,10Z,13Z,16Z,19Z)/19:0) 1315 PS(22:2(13Z,16Z)/16:0) 1317 PS(22:6(4Z,7Z,10Z,13Z,16Z,19Z)/19:0) 2331 cimicifoetiside A 2334 GlcAbeta-Cer(d18:1/18:0) 2336 PC(20:5(5Z,8Z,11Z,14Z,17Z)/14:1(9Z))当累计贡献率为99%时,得到的具体实验结果如图2所示。同样的,图中脂质对样本集的影响程度随着箭头的方向减小,图中编号所代表的脂质具体描述如表1所示。图2(a)显示了PCA和KPCA方法均获得9种脂质对DS样本集具有很大影响,其中有8种脂质是相同的,除此之外,PCA方法发现No.1302同样是主成分之一,KPCA也获得另一种脂质No.1244对样本集的影响较大。对于HS样本集获得的实验结果如图2(b)所示,使用KPCA方法得到5种对样本集有较大影响的脂质,分别是No.2334,No.2336,No.2331,No.608,No.776,其中4种与PCA方法发现的脂质相同。在图2(c)中,使用PCA和KPCA方法得到相同的实验结果,均包括15种脂质对NC样本集具有显著影响。
本文编号:3038869
【文章来源】:计算机仿真. 2020,37(11)北大核心
【文章页数】:4 页
【部分图文】:
PCA和KPCA累计贡献率为95%时实验结果
表1 图1和图2中脂质编号的具体描述 编号 描述 608 PC(20:0/26:0) 776 PC(34:0/16:0) 1061 Tacrolimus 1205 1-(6-[5]-ladderane-hexanoyl)-2-(8-[3]-ladderane-octanyl)-sn-glycerophosphocholine 1236 1-(8-[3]-ladderane-octanoyl)-2-(8-[3]-ladderane-octanyl)-sn-glycerophosphoethanolamine 1240 PS(22:6(4Z,7Z,10Z,13Z,16Z,19Z)/18:1(9Z)) 1244 PS(20:5(5Z,8Z,11Z,14Z,17Z)/20:0) 1245 1-(8-[3]-ladderane-octanoyl)-2-(8-[3]-ladderane-octanyl)-sn-glycerophosphoethanolamine 1264 PS(22:6(4Z,7Z,10Z,13Z,16Z,19Z)/19:1(9Z)) 1266 1-(6-[3]-ladderane-hexanoyl)-2-(8-[3]-ladderane-octanyl)-sn-glycerophosphocholine 1279 1-(6-[3]-ladderane-hexanoyl)-2-(8-[3]-ladderane-octanyl)-sn-glycerophosphocholine 1283 PS(18:4(6Z,9Z,12Z,15Z)/22:0) 1302 PS(20:3(8Z,11Z,14Z)/19:0) 1304 (3"-sulfo)Galbeta-Cer(d18:0/18:0(2OH)) 1311 PS(22:6(4Z,7Z,10Z,13Z,16Z,19Z)/19:0) 1315 PS(22:2(13Z,16Z)/16:0) 1317 PS(22:6(4Z,7Z,10Z,13Z,16Z,19Z)/19:0) 2331 cimicifoetiside A 2334 GlcAbeta-Cer(d18:1/18:0) 2336 PC(20:5(5Z,8Z,11Z,14Z,17Z)/14:1(9Z))当累计贡献率为99%时,得到的具体实验结果如图2所示。同样的,图中脂质对样本集的影响程度随着箭头的方向减小,图中编号所代表的脂质具体描述如表1所示。图2(a)显示了PCA和KPCA方法均获得9种脂质对DS样本集具有很大影响,其中有8种脂质是相同的,除此之外,PCA方法发现No.1302同样是主成分之一,KPCA也获得另一种脂质No.1244对样本集的影响较大。对于HS样本集获得的实验结果如图2(b)所示,使用KPCA方法得到5种对样本集有较大影响的脂质,分别是No.2334,No.2336,No.2331,No.608,No.776,其中4种与PCA方法发现的脂质相同。在图2(c)中,使用PCA和KPCA方法得到相同的实验结果,均包括15种脂质对NC样本集具有显著影响。
本文编号:3038869
本文链接:https://www.wllwen.com/yixuelunwen/pifb/3038869.html
最近更新
教材专著