当前位置:主页 > 医学论文 > 基础医学论文 >

基于Kullback-Leibler距离对致病位点位置的识别

发布时间:2020-11-19 06:24
   通过对KullbackLeibler距离的研究,计算出基因位点分布之间的KullbackLeibler距离,根据KullbackLeibler距离值找出某种疾病最有可能的一个或几个致病位点的位置信息,实现对致病位点的位置信息的快速识别,为遗传学中发现遗传病或性状的遗传机理方法做出参考.
【部分图文】:

频数图,频数,取值,纵坐标


I,X2,?X3分别是后5Q0个患者每个位点的每种碱基组合编码情况出现的次数,这里把有病??和没病的人们相应位点出现的频率作为位点的分布概率,并结合R.统计软件计算出对应的??KullbackLeibler距离,然后根据KL值的大小,很快地识别出疾病最有可能的一个或几个致??病位点的位置信息.最后将这两组数据按照KL距离的公式进行处理,我们分析得到当两组??样本数据的KL距离越大的位点信息越是可能导致患病的位点信息.用R软件来画出KL值??的频数分布图和KL值的箱图,如下图所示:??图1的纵坐标表示KL值出现的频数,横坐标表示KL的取值,可以很直观的看出大部??分位点的KL值都非常小,我们得知只有少数的一些位点对该病的影响较大;图2从下至上??的五条水平线依次表示最小值、第一四分位点、中位数、第三四分位点、最大值.同时,我们??通过R,语言中的函数可以看出具体的数值.X朽十算得到的KL值,按照其值的大??小进行降序排列,以第一四分位点作为阈值来筛选样本位点.这样,我们就将原先的雑45个??位点信息,压缩到7082个位点,完成了对样本信息的降维处理,按照计算出的KL值的大小??降序排列,仅截取前20个位点信息结果如表2.??
【相似文献】

相关期刊论文 前4条

1 王日生;R上的保持某些距离值不变的映射[J];南开大学学报(自然科学版);2003年03期

2 张世平;;一种快速识别离散系统阶数的方法[J];吉林化工学院学报;1986年03期

3 周影辉;倪中新;谢琳;;泊松序列中变点的快速识别方法[J];统计与决策;2013年11期

4 张伟业;魏翠萍;;基于犹豫模糊语言信息的EDAS决策方法[J];曲阜师范大学学报(自然科学版);2017年01期



本文编号:2889823

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/jichuyixue/2889823.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户12a36***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com