基于组分特征的tracrRNA识别和预测
发布时间:2024-05-14 00:56
CRISPR-Cas系统是细菌和古菌的RNA介导的适应性免疫系统,可以针对性切割外源核酸序列,目前已发展为使用最为普遍的基因编辑工具。II型CRISPR-Cas的部分亚型(如A、B、C)依赖于反式激活CRISPR RNA(tracrRNA)干扰入侵序列及使pre-crRNA成熟。经RNA酶III处理后,tracrRNA与crRNA复合体激活CRISPR相关核酸内切酶Cas9(Csn1)切割位点特异性同源的靶DNA。因此识别tracrRNA对于研究开发新的CRISPR-Cas系统的基因组编辑工具有着重要的作用。本文收集了54条已知的tracrRNA构成阳性训练集,对已知的tracrRNA随机改组,构造具有tracrRNA结构特征并且与已有tracrRNA具有相同核苷酸组成的“假tracrRNA”数据集,构成阴性训练集。通过伪核苷酸组分PseKNC方法表征原始训练集,作为训练分类器的特征数据集。采用机器学习的方法构造分类器,在训练过程中,使用留一法交叉检验评估分类器的性能,使用基于方差分析的特征选择技术进行特征优化,去除模型构建过程中包含的不相关的冗余特征,最终获得基于最优PseKNC参数...
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
本文编号:3972959
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
图1-1CRISPR-Cas系统的组织,展示六种主要CRISPR-Cas型的代表操纵子
图1-1CRISPR-Cas系统的组织,展示六种主要CRISPR-Cas型的代表操纵子。仅存在于某些亚型中的基因以虚线轮廓显示,参与干扰的基因为红色,参与crRNA的生物发生的基因为黄色,参与适应的基因为蓝色。显示tracrRNA相关基因在II型CRISP....
图1-2II型CRISPR-Cas9系统示意图,展示tracrRNA的加工和干扰作用[15]
图1-1CRISPR-Cas系统的组织,展示六种主要CRISPR-Cas型的代表操纵子。仅存在于某些亚型中的基因以虚线轮廓显示,参与干扰的基因为红色,参与crRNA的生物发生的基因为黄色,参与适应的基因为蓝色。显示tracrRNA相关基因在II型CRISP....
图1-3II型干扰复合物
图1-3II型干扰复合物。显示各核酸的互补区段,茎环(SL),三螺旋等特征[15]。原核生物基因组中tracrRNA的相关特征和功能是CRISPR-Cas系统研究的组成部分。tracrRNA在结构上具有多样性,可以形成短茎环结构(3-6bp)和非规范碱基对(eg.....
图2-12型伪核苷酸PseKNC中特征的关联模式示意图,显示
伪核苷酸PseKNC中特征的关联模式示意图,显示定a),间隔一组基础组分的双组分组(b),间隔两组基本组分标的P等价于前述文中的基础组分X,在引文中称之为K-元)和()表示二联体碱基对RiRi+1和Ri+m。含三个不确定参数。....
本文编号:3972959
本文链接:https://www.wllwen.com/projectlw/swxlw/3972959.html