基于卷积神经网络的序列特异性预测研究
发布时间:2017-12-24 16:29
本文关键词:基于卷积神经网络的序列特异性预测研究 出处:《云南大学》2016年硕士论文 论文类型:学位论文
更多相关文章: 序列特异性 模体识别 DNA结合蛋白 卷积神经网络
【摘要】:基因序列特异性的预测无论是在基因分析领域还是基因调控领域都扮演着重要作色,DNA和RNA结合蛋白的特异性模式序列对致病基因的发现也具有指导性作用。然而随着分子生物学的发展,生物数据量呈现爆炸式增长,通过生物实验和统计分析来寻找序列特异性的传统方法已经很难从海量数据中挖掘出有用数据,且时间和人力成本也太高。卷积神经网络是近几年新兴的一种深度学习技术,目前在图像、语音识别及自然语言处理领域应用较广,发展较成熟。这种技术基于多层感知机(multi-layer perceptron),多层感知机是上个世纪八十年代由Rumelhart、Williams、Hinton和LeCun等人共同提出的,其目标是通过模拟人脑神经元的信息处理过程,用神经元网络来描述现实世界中的复杂规则(一般是函数形式)。但多层感知机结构过于简单,导致描述事物或者规则的能力有限。针对这一问题,人工智能专家们经过不懈努力,不断增加神经网络的深度,同时将不同层划分为不同功能,从而催生出了卷积神经网络。本文主要关注点是模体识别问题中模体的序列特异性,针对这个问题,使用卷积神经网络建立了相应的序列预测模型。该模型主要涉及几个阶段:首先将字符串序列转化为数值编码矩阵,再用预测模式的数值矩阵对序列编码矩阵进行卷积运算,从而自动从序列中提取预测模式的特征,卷积输出的矩阵中每一个元素需要与给定的阈值相减,只保留结果大于0的元素传入下一层;再将经过阈值矫正过的输出矩阵输入池化(pooling)层,池化层的作用是对输入数据进行压缩,只保留主要特征;经过池化压缩的矩阵输入一个全连接的神经网络层,这一层通过计算加权和得到一个实数输出分数,将该分数与目标分数相比较,计算出误差,反向传播给前面各层,通过误差调整各层参数,最终拟合得到一个模型,就是序列特异性预测模型。
【学位授予单位】:云南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:Q811.4;TP183
,
本文编号:1329116
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1329116.html