3D卷积神经网络的结构优化及中枢神经系统药物的识别
发布时间:2021-04-03 00:13
该文研究了如何利用3D-CNN识别中枢神经系统(CNS)药物和non-CNS药物。首先,构建CNS药物和non-CNS药物数据集并优化小分子构象;然后,以3D网格矩阵编码小分子结构,作为3D-CNN模型的输入;接着,在模型训练中,采用正交实验法对3D-CNN模型的超参数进行快速优化;最后,使用外部测试集检验模型,达到ACC为84. 3%,MCC为0. 685,AUC为0. 884的泛化性能。实验表明,在正交实验法获取可靠超参数组合的基础上,3D-CNN模型对于CNS药物的识别具有良好效果,所构建的模型为设计新的CNS药物提供了基础。
【文章来源】:西北大学学报(自然科学版). 2020,50(01)北大核心CSCD
【文章页数】:8 页
【部分图文】:
图1 分子在3D网格中的示意图
3D-CNN的多个超参数直接影响CNN的结构,本文根据正交实验进行参数组合,比较每种组合下模型的交叉验证结果,从而构建可靠的3D-CNN模型,模型结构如图2所示。表2和表3分别是在两个和3个卷积层时的正交实验结果,其中,每个数值都是五折交叉验证的平均。使用3个卷积层时,最佳参数是第6个超参数组合,即卷积核大小为5,卷积步长3,下采样核大小及步长为2,初始卷积核个数为64,此时所有预测率都在80%以上,MCC和AUC分别为0.629,0.848。当采用两个卷积核时,最佳参数是第7个超参数组合,即卷积核大小为7,卷积步长1,下采样核大小及步长为4,初始卷积核个数为64,此时的SEN比3个卷积核时低0.5%,SPE基本不变,ACC,MCC,AUC也都略低于3个卷积核时的结果。然而,这两种结果非常接近,而且参数组合相同时,不同的卷积层数并没有表现出明显的结果差异,这与Simonyan[30]提到的两个3*3卷积层与一个5*5卷积层的效果几乎相同的情况一致,不同的卷积层数通过调整其他超参数也可以达到类似的效果。
为了验证上述的0.3Dropout是否增强了模型的鲁棒性,将不使用Dropout和使用0.3Dropout的模型分别对独立测试集进行测试。从图3中看到,使用0.3比例的Dropout层时,模型对独立测试集的泛化能力更好,SPE从81.5%上升到85.2%,ACC,MCC,AUC分别提升了1.9%,0.037,0.016。这表明,通过随机丢弃全连接层30%的神经元,增强了模型的健壮性,使模型在CNS药物与non-CNS药物的识别上具有更好的泛化能力。3 结语
本文编号:3116225
【文章来源】:西北大学学报(自然科学版). 2020,50(01)北大核心CSCD
【文章页数】:8 页
【部分图文】:
图1 分子在3D网格中的示意图
3D-CNN的多个超参数直接影响CNN的结构,本文根据正交实验进行参数组合,比较每种组合下模型的交叉验证结果,从而构建可靠的3D-CNN模型,模型结构如图2所示。表2和表3分别是在两个和3个卷积层时的正交实验结果,其中,每个数值都是五折交叉验证的平均。使用3个卷积层时,最佳参数是第6个超参数组合,即卷积核大小为5,卷积步长3,下采样核大小及步长为2,初始卷积核个数为64,此时所有预测率都在80%以上,MCC和AUC分别为0.629,0.848。当采用两个卷积核时,最佳参数是第7个超参数组合,即卷积核大小为7,卷积步长1,下采样核大小及步长为4,初始卷积核个数为64,此时的SEN比3个卷积核时低0.5%,SPE基本不变,ACC,MCC,AUC也都略低于3个卷积核时的结果。然而,这两种结果非常接近,而且参数组合相同时,不同的卷积层数并没有表现出明显的结果差异,这与Simonyan[30]提到的两个3*3卷积层与一个5*5卷积层的效果几乎相同的情况一致,不同的卷积层数通过调整其他超参数也可以达到类似的效果。
为了验证上述的0.3Dropout是否增强了模型的鲁棒性,将不使用Dropout和使用0.3Dropout的模型分别对独立测试集进行测试。从图3中看到,使用0.3比例的Dropout层时,模型对独立测试集的泛化能力更好,SPE从81.5%上升到85.2%,ACC,MCC,AUC分别提升了1.9%,0.037,0.016。这表明,通过随机丢弃全连接层30%的神经元,增强了模型的健壮性,使模型在CNS药物与non-CNS药物的识别上具有更好的泛化能力。3 结语
本文编号:3116225
本文链接:https://www.wllwen.com/yixuelunwen/yiyaoxuelunwen/3116225.html
最近更新
教材专著