当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的配体分子海量特征筛选及回归方法研究

发布时间:2020-12-31 17:20
  特征筛选和深度学习是机器学习的重要分支。现如今各种结构和不同规模的数据充斥我们生活的方方面面。我们希望有效地提取数据中的模式并且能够建立高预测精度的可解释模型。而识别重要的可解释性特征的一项流行技术就是特征筛选。近来由于在各种机器学习任务中取得了巨大的成功,深度学习获得了大量研究者的关注。深度学习的一个重要特点就是提取特征。通过挖掘数据集中的关系,可以更准确的找到特征;通过增加层数来增加网络的复杂性,可以从数据中提取更高层次的特征,或者是与结构关联更少的特征,或者是更多与数据内容相关的特征。本文的主要贡献如下:(1)提出基于加强对偶多面体LASSO方法的配体分子海量特征筛选方法,大幅加速配体海量特征筛选过程,去除大部分无关的特征,使得后续学习仅需在小部分特征上进行,大幅提高了模型的学习效率。实验结果验证了我们算法的有效性。(2)提出了一种全新的基于加权深度学习和随机森林的GPCR相关配体分子活性的预测算法WDL-RF,它包括基于新型加权深度学习的分子指纹生成阶段和基于随机森林模型的生物活性预测两个阶段。该方法的特点在于,它是一个端到端的预测学习框架。实验结果显示,在所有数据集及模型评价... 

【文章来源】:南京邮电大学江苏省

【文章页数】:58 页

【学位级别】:硕士

【部分图文】:

基于深度学习的配体分子海量特征筛选及回归方法研究


特征筛选过程

模型图,模型,卷积,感受野


大学专业学位硕士研究生学位论文 第二章 深度学习及特征筛选相要接收上层中相邻的几个神经元的输出(或称之为局部感受野)。此外,利用同测图像的各个部分,这就使神经网络中的权重数量减少。这种策略也被称为权积层之后通常是特征汇合操作,这增强了模型对特征变化的容忍度。汇合操作卷积层的输出分割成小的集合,之后从每个集合中采样一个值(取平均值或者最一层的输入。利用局部感受野,第一个卷积层中的神经元提取低层次的视觉特、点和角。随后的其他卷积层将这些特征组合起来形成更高层次的特征。如图是一个卷积神经网络的模型。

结构图,结构图,特征筛选,包裹式


图 2.3 AlexNet Alex 的卷积神经网络结构图此外,CNN 还有一个鲜明的特点,它将特征学习和分类或回归模型学习融合在一起,省去大部分的预处理过程,直接从像素图像中识别视觉实体。随着近年来 CNN 的广泛,人工特征逐渐在模式识别领域没落。专家的领域知识对于设计视觉识别系统变得越来重要。与其他方法相比,CNN 在许多模式识别任务[33]-[35]上表现出优越的性能。.2 特征筛选相关技术常见的特征筛选方法大致上可以分为三种:过滤式、包裹式、嵌入式。过滤式特征筛法是先对数据集进行特征筛选,然后在训练学习器,也就是说特征筛选过程与后续选择习器无关。这也就是说先使用特征筛选对初始特征进行过滤,之后在使用过滤后的特征练学习器。与过滤式特征筛选不考虑后续学习器不同,包裹式特征筛选直接把最终将要的学习器的性能作为特征子集的评价标准[2]。也就是说,包裹式特征筛选的目的是为给定


本文编号:2950006

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2950006.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bfcc1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com