对基因组内不同序列分布差异进行量化的探讨
本文关键词:对基因组内不同序列分布差异进行量化的探讨
更多相关文章: 基因组序列 分布差异 Kolmogorov-Smirnov检验 图心 数值模拟
【摘要】:目的针对DNA词频分析中序列分布问题,探讨对基因组内不同序列的分布差异进行量化的可行性。方法该研究采用数值模拟的方法对Kolmogorov-Smirnov检验的统计量和累积概率曲线下图形的图心进行了比较。结果随着样本含量的增加,两个指标的离散趋势逐渐减小,但其集中趋势并没有受到明显影响,且不同的分布集中于不同的位置;当样本含量为100时,所能判别的最小统计量差异约为0.1,图心差异约为0.02;使用统计量指标时,需采用两个基准分布才能将5个待测分布分开,而图心指标可以直接将5个待测分布分开。结论两个指标都可以看作分布差异的量化指标,但在大多数情况下样本含量应该大于100;当需要在同一坐标系表示不同分布时,图心可能是一个较好的选择。
【作者单位】: 山西医科大学公共卫生学院医学统计学教研室;美国密西根州立大学统计与概率系;
【基金】:国家自然科学基金资助项目(31071156)
【分类号】:R3416
【正文快照】: 基因组常被比喻为一本“生命天书”,如果有几个关键词在书中出现的位置比较接近,则其关系可能比较密切。反之,若其出现的位置具有明显差异,则其可能关系较远。如果把序列看作是基因组内的关键词,则序列在基因组上出现的位置差异则可能说明这些序列之间的功能差异。如果两个重
【相似文献】
中国期刊全文数据库 前10条
1 李乐霞;李自强;张鹏;;定量实验中样本含量的设计与数据处理[J];数理医药学杂志;2007年05期
2 赵耐青;生存分析的最小样本含量计算[J];上海医科大学学报;1994年05期
3 刘勖;临床试验设计与数据处理(四)[J];疑难病杂志;2003年01期
4 刘建平;临床试验样本含量的计算[J];中国中西医结合杂志;2003年07期
5 张循范,陈佩玲,刘翠枝,林培;生物等效性研究的试验例数设计[J];数理医药学杂志;1994年02期
6 古志昂;实验设计的基本原则[J];宁夏医学院学报;1995年03期
7 赵宜;医学科研中统计学设计要点[J];中国斜视与小儿眼科杂志;1995年03期
8 朱隆高!吉林132001,于苏荣!吉林132001,胡志宏!吉林132001,董莉萍!吉林132001,雷鸣!吉林132001;二项分布的单因素方差分析初探[J];北华大学学报(自然科学版);1997年01期
9 高晨燕,冯毅,陈峰,金丕焕,苏炳华;临床试验的统计学指导原则(Ⅰ)[J];中国临床药理学杂志;1999年03期
10 冯启明;;多元统计分析方法在医学科研中的应用[J];广西医学;2006年02期
中国重要会议论文全文数据库 前1条
1 余红梅;王彤;刘桂芬;王琳娜;张岩波;仇丽霞;赵晋芳;;Cox回归模型诊断及其医学应用研究报告[A];2005—2006山西省统计科研成果汇编[C];2006年
中国重要报纸全文数据库 前1条
1 军事医学科学院生物医学统计学咨询中心 胡良平;自相矛盾的统计分析结果是如何产生的[N];中国医药报;2011年
中国硕士学位论文全文数据库 前2条
1 骆常好;惩罚logistic回归与多因子降维法交互作用分析及其应用[D];山西医科大学;2009年
2 郝永红;广义线性模型的稳健估计及其医学应用[D];山西医科大学;2009年
,本文编号:1155833
本文链接:https://www.wllwen.com/yixuelunwen/binglixuelunwen/1155833.html