当前位置:主页 > 医学论文 > 畜牧兽医论文 >

基于全基因组SNP位点的羊的品种鉴别方法研究

发布时间:2020-12-22 12:22
  在实际生活中,品种鉴别有着多种多样的应用,同时具有重要的研究价值。但是近年来针对羊的品种鉴别的相关研究较少,如今生物技术正在飞速发展中,越来越多的羊的基因表达信息可以被测定。这使得研究者能够利用基因数据对未知品种的羊进行分类。文中选用基因芯片技术测定羊的基因,是因为基因芯片技术发展迅速现在已经能够在短时间内迅速的获取成千上万的基因数据。然而此方法存在以下问题:样本的个数不能和基因数据相匹配,导致用这种方法获取的基因数据存在本高维小样本的特点。本文利用的单核苷酸多态性(single nucleotide polymorphism,SNP)数据为基因数据的一种也存在同样的弊端,这使得众多学者将怎样高效的处理此类数据作为了研究的重点与难点。本文主要研究内容为:挑选出高信息量SNP位点以此为特征对未知的羊的品种正确分类。在研究中主要存在两个难点:(1)怎样从高维的数据中选取有效的特征;(2)如何选择适合本文数据类型的分类算法。本文首先利用传统的LSBL统计方法对少数样本进行实验,探寻数据中蕴含的规律并对其实现方法进行改进。最终达到降低实现复杂度提高计算效率的目的。由于传统分析方法中没有考虑到本... 

【文章来源】:新疆大学新疆维吾尔自治区 211工程院校

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

基于全基因组SNP位点的羊的品种鉴别方法研究


SNP发生转化示意图

品种鉴别,软件,对数比


2.2.3 品种鉴别检验软件的实现在上一节中对 SNP 位点筛选后,在验证时利用 EXCEL 计算不同品种的对数比对不同品种作出判断。这种验证方法实现过程较为繁琐容易引入人为误为了节省计算时间减少人为的错误,提高运行速度本文以 Maltab 平台为基计了一款品种鉴别验证软件。软件界面如图 2.2 所示。

主成分分析,品种分类,分类特征,算法


33(a)(b)图 4.3:(a)为 PC1 与 PC2 构成的主成分分析图(b)为 PC1 与 PC3 构成的主成分分析图4.3 利用 KNN 算法进行品种分类在第 3.3.1 节中可以得知对于 KNN 算法其中 K 值选择的问题尤为重要。所以我们先要将由 PCA 筛选出来的 520 个 SNP 位点为分类特征,利用训练集研究

【参考文献】:
期刊论文
[1]利用50K芯片数据分析中国11个地方绵羊群体的遗传结构[J]. 袁泽湖,王慧华,胡师金,朱才业,赵福平,张莉,杜立新,魏彩虹.  畜牧兽医学报. 2016(05)
[2]SNP的研究进展及其在家畜育种中的应用[J]. 石磊,岳文斌.  畜禽业. 2007(03)
[3]一种新的分子标记——单核苷酸多态(SNP)[J]. 曾燕如,黄敏仁,王明庥.  南京林业大学学报(自然科学版). 2003(03)
[4]单核苷酸多态性的研究进展及其应用[J]. 包广宇.  国外医学.遗传学分册. 2003(01)
[5]单核苷酸多态性的研究进展[J]. 杨昭庆,洪坤学.  国外医学.遗传学分册. 2000(01)



本文编号:2931763

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/dongwuyixue/2931763.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户934a8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com