DNA池方法在估计多位点单体型频率中的应用
本文选题:DNA混合池 + EM算法 ; 参考:《黑龙江大学》2012年硕士论文
【摘要】:随着社会科学技术的发展,医疗水平日新月异.层出不穷的诊断手法为疾病治疗提供了更加准确的信息,越来越多由基因引起的疾病被人们所发现,这就使得人们对基因疾病的研究愈加重视.一般来说,单体型通常被认为是不同SNPs位点连锁信息的丰富携带者,因此估计单体型频率的研究价值极大.目前人们的研究大多集中在对多个位点且每个位点有两个等位基因的单体型上,但是现在通过临床诊断,大量由多个等位基因控制的疾病被人们所发现,因此人们对多等位基因单体型频率的研究重视程度越来越高. 如何来研究多等位基因的单体型频率是一个重要课题,本文从减少工作量,降低研究成本以及缩短研究周期的角度出发,利用DNA池的思想方法,借助EM算法估计出多等位基因单体型的频率.文中每个DNA池中放入两个样本,重点研究单体型有两个位点且每个位点有三个等位基因的情况.通过对DNA混合池的观测得出观测数据,进而利用EM算法的思想对多等位基因单体型的频率进行估计,最后利用统计软件进行模拟研究.
[Abstract]:With the development of social science and technology, medical treatment level changes with each passing day. Endless diagnostic techniques provide more accurate information for the treatment of diseases. More and more diseases caused by genes have been discovered, which makes people pay more attention to the research of genetic diseases. Haplotypes are generally considered to be rich carriers of linkage information at different SNPs loci, so the study of haplotype frequency estimation is of great value. At present, most studies focus on haplotypes with multiple loci and two alleles per locus, but now, through clinical diagnosis, a large number of diseases controlled by multiple alleles have been discovered. Therefore, people pay more and more attention to the study of multi-allele haplotype frequency. How to study the haplotype frequency of multiple alleles is an important subject. In this paper, from the angle of reducing the workload, reducing the research cost and shortening the research period, we use the thought method of DNA pool. The frequency of multiallelic haplotype was estimated by EM algorithm. In this paper, we put two samples into each DNA pool, and focus on the situation that haplotype has two loci and each locus has three alleles. The observed data are obtained from the observation of DNA mixing cell, and then the frequency of multi-allelic haplotype is estimated by using EM algorithm. Finally, the simulation research is carried out by using statistical software.
【学位授予单位】:黑龙江大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:R346
【共引文献】
相关期刊论文 前10条
1 曾建军;夏慧异;叶仁玉;;J_(1N)统计量的优化计算[J];安徽大学学报(自然科学版);2005年06期
2 张领科;王中原;王枫;;基于命中概率建立通用射表判据的研究[J];兵工学报;2006年02期
3 程维虎,陈冬;Logistic分布参数的渐近置信估计(Ⅰ)[J];北京工业大学学报;2001年02期
4 程维虎;利用样本分位数的极值分布的参数估计[J];北京工业大学学报;2002年03期
5 陈乃辉;;条件数学期望的构造性表示[J];北京工业大学学报;2006年06期
6 吴建成,吴剑国;基于马氏链样本模拟的潜艇耐压结构系统可靠性计算[J];船舶力学;2003年04期
7 章栋恩;随机化应答调查方案的参数估计问题[J];纯粹数学与应用数学;2000年02期
8 陈占寿;龙兵;刘瑞元;;应力为SGBVE分布强度为指数分布下结构可靠度的估计[J];纯粹数学与应用数学;2006年01期
9 李文东;张建军;乔昱亚;;指数分布场合异常数据的检验[J];长春大学学报;2006年08期
10 黄智伟,黄琛;DNA检测技术的研究现状[J];传感器世界;2001年01期
相关会议论文 前2条
1 熊海林;邓方林;沈永福;张国良;;逆Gamma分布参数的一种矩估计法[A];2001中国控制与决策学术年会论文集[C];2001年
2 曹晨;刘心声;;Probit模型的M-H算法[A];江苏省现场统计研究会第十次学术年会论文集[C];2006年
相关博士学位论文 前10条
1 王振龙;统计哲学思考[D];东北财经大学;2001年
2 甘宇;多传感器数据融合中的两个问题[D];四川大学;2002年
3 郑培;机动车驾驶员驾驶疲劳测评方法的研究[D];中国农业大学;2002年
4 周杰;信息处理与融合中递推算法研究[D];四川大学;2003年
5 孔祥维;信息安全中的信息隐藏理论和方法研究[D];大连理工大学;2003年
6 牛海军;混合流程生产系统优化调度方法研究[D];西北工业大学;2003年
7 曾林蕊;半参数广义线性模型若干问题的研究[D];华东师范大学;2004年
8 王双成;面向智能数据处理的图形模式研究[D];吉林大学;2004年
9 詹亚锋;通信信号自动制式识别及参数估计[D];清华大学;2004年
10 曾昭书;HLA-B基因多态性在法医学中的应用研究[D];中国医科大学;2005年
相关硕士学位论文 前10条
1 黄秀丽;南瓜属4个栽培种间亲缘关系的探讨及南瓜白粉病抗性评估的初步研究[D];汕头大学;2005年
2 郭刚;载脂蛋白B、CⅢ、E基因多态性与脂肪肝患者脂代谢关系的研究[D];新疆医科大学;2004年
3 王洁;奇异线性模型中最小二乘估计的相对效率[D];广西师范大学;2000年
4 江冬明;线性混合模型的影响分析[D];北京工业大学;2001年
5 胡振宇;贝叶斯学习的先验分布的研究[D];广西师范大学;2001年
6 李佼瑞;套利定价模型(APT)的统计分析及在我国股票市场的应用研究[D];陕西师范大学;2002年
7 冯艳;一种产生随机数新方法的研究与实现[D];北京工业大学;2002年
8 肖兵;一列非线性模型的LS估计及非线性度量[D];湖南大学;2002年
9 彭向阳;多元线性模型回归系数的估计及其性质[D];湘潭大学;2002年
10 成冬梅;中国第三产业国际竞争力实证分析[D];福州大学;2003年
,本文编号:1981179
本文链接:https://www.wllwen.com/xiyixuelunwen/1981179.html