秀丽隐杆线虫基因组编码区的碱基分布特征参数研究
发布时间:2023-02-15 09:58
【目的】考察秀丽隐杆线虫(Caenorhabditis elegans)基因组编码区(Coding sequences,CDSs)的碱基使用特点,并提炼出能够区分CDSs与非编码区的碱基成分偏移特征参数。【方法】在研究碱基成分偏移特性基础上,定义一个新的参数d,探索d值的分布规律;采用从秀丽隐杆线虫基因组6类不同的DNA序列中随机抽样的方式,分析并验证该指标作为基因组CDSs特征参数的可行性。【结果】参数d经过线性变换后近似服从对数正态分布;抽样分析显示分别有81.6%的CDSs、70.7%的外显子、21.8%的内含子、4.7%的随机序列、17.8%的5′非翻译区和31.4%的3′非翻译区落在d值变换后的特征取值区间内,即被预测为基因组CDSs。【结论】碱基成分偏移指数d可以作为表征基因组编码区的特征参数,它的特定取值区间能很好地区分CDSs(或开放阅读框及它的子片段)和其他非编码区。
【文章页数】:7 页
【文章目录】:
1 材料与方法
1.1 数据和问题的定义
1.1.1 秀丽隐杆线虫全基因组序列数据的获取
1.1.2 秀丽隐杆线虫基因组CDSs的数学特征参数d
1.2 用于特征参数d估算的C语言程序设计
1.3 基因组序列编码区的统计分析
1.4 参数d的检验与CDSs预测效果的评价
2 结果
2.1 秀丽隐杆线虫基因组中密码子的使用和组成
2.2 秀丽隐杆线虫基因组的参数D和d值的分布规律
2.3 基于d值的CDSs的预测验证
3 讨论
本文编号:3743293
【文章页数】:7 页
【文章目录】:
1 材料与方法
1.1 数据和问题的定义
1.1.1 秀丽隐杆线虫全基因组序列数据的获取
1.1.2 秀丽隐杆线虫基因组CDSs的数学特征参数d
1.2 用于特征参数d估算的C语言程序设计
1.3 基因组序列编码区的统计分析
1.4 参数d的检验与CDSs预测效果的评价
2 结果
2.1 秀丽隐杆线虫基因组中密码子的使用和组成
2.2 秀丽隐杆线虫基因组的参数D和d值的分布规律
2.3 基于d值的CDSs的预测验证
3 讨论
本文编号:3743293
本文链接:https://www.wllwen.com/projectlw/swxlw/3743293.html