秦川牛肌肉生长发育相关基因和蛋白质的筛选及其初步鉴定

发布时间:2018-04-30 12:47

  本文选题:秦川牛 + 肌肉发育 ; 参考:《西北农林科技大学》2014年博士论文


【摘要】:牛的肌肉发育是一个十分复杂的过程,涉及大批基因的表达及网络式的调控。目前,人们对牛肌肉发育的分子调控机理了解得并不清楚,因此,有必要进一步的发掘与牛肌肉发育相关的基因,并对其功能和调控机理进行研究。本研究以妊娠135天左右的胚胎和出生后30月龄的秦川牛背最长肌为研究对象,利用高通量转录组测序技术(RNA-Seq)、同位素标记相对和绝对定量技术(iTRAQ)和液相色谱串联质谱技术(LC-MS/MS)等筛选出了一大批在牛肌肉发育过程中差异表达的基因和差异表达的蛋白,并对差异基因和蛋白进行了功能注释和通路分析;运用实时定量PCR(qPCR)技术对筛选出的部分与肌肉发育相关的差异基因进行了验证,并分析其在牛肌肉发育过程中的表达情况;此外,还将获得的蛋白质组结果与转录组结果进行了关联分析。主要研究内容和结果如下: 1.获得了高质量Clean Reads转录组数据,与最新的牛参考基因组进行比对,胎牛组和成年牛组比对上的Reads数分别为20255767条和20427874条,占牛的参考基因组的百分比例分别为79.11%和77.92%。 2.以错误发生率FDR≤0.001且|log2Ratio|≥1作为判定差异表达基因的标准,共筛选出6800个差异表达的基因,其中以胎牛组Emb135d为对照,成年牛组30M背最长肌转录组中上调表达的基因有1893个,下调表达的基因有4907个。通过GO功能显著性富集分析,差异基因分别被显著富集到95个与生物学过程相关的条目,其中大部分条目涉及到生长发育过程;26个与分子功能相关的条目;71个与细胞组成相关的条目。KEGG通路分析表明,差异基因被显著富集到了15条通路中。 3. qPCR检测了47个差异基因在成年牛背最长肌组织中的表达情况,结果表明实时定量结果与转录组测序结果基本一致,说明本实验的分析结果基本可以反映牛背最长肌组织内基因的真实表达情况。此外,还进一步检测了这47个差异基因在胎牛期Emb135d,新生牛期NB,成年牛期30M三个不同时期的肝、肺、脾、肾、心、胃、肠、肌肉(背最长肌)、脂肪(腹部脂肪)中的表达情况,定量结果发现有25个基因在肌肉组织中呈现出特异性表达,有4个基因在脂肪组织中呈现出特异性表达。 4.通过比较潜在基因模型与现有基因注释的差别,对基因的结构进行优化,延长基因的5’端和3’端。结果显示成年牛组30M中有2157个基因的5’端进行延长,3531个基因的3’端进行延长;胎牛组Emb135d中有2571个基因5’端进行了延长,4625个基因3’端进行了延长。此外,还检测到了大量的新转录本,其中成年牛组30M中检测到24464个新转录本,胎牛组Emb135d中检测到29994个新转录本。同时,在秦川牛肌肉组织中,还发现了4种可变剪接模型,分别是外显子跳跃、内含子滞留、可变5’端剪切位点和可变3’端剪切位点模型,其中,可变3’端剪切模型是4种可变剪切模型中最常见数量最多的一种,约占40%的百分比例;内含子滞留剪切模型是4种可变剪切模型中最稀有数量最少的一种。 5.通过比较新测序个体在基因组上的共有序列和参考序列,鉴定出单核苷酸多态性(SNPs)。成年牛组30M中,共鉴定到31334个假定的SNPs;在胎牛组Emb135d中,共鉴定到30618个假定的SNPs。据相关文献报道,,牛29号染色体上存在着大量与生长和肉性状相关的基因,因此,选取了位于牛29号染色体上的CSRP基因家族作为候选基因来验证假定的SNPs。将CSRP基因家族扩增后的测序序列与参考序列进行比对,共发现了8个SNPs,分别用不同的酶对这些位点进行酶切,酶切结果证实与测序结果相一致,说明本研究鉴定出的假定SNPs分析结果准确性和可靠性较高。此外,在404头秦川牛群体中,单个SNP位点不同基因型与生长和胴体性状的关联分析结果显示,一些SNP位点与体高,体长,腰角宽,宰前活重,胴体重和屠宰率等性状显著(或极显著)相关。 6.通过iTRAQ和LC-MS/MS技术,在成年牛组30M和胎牛组Emb135d中,共获得了115380个二级谱图;14250个谱图能匹配到参考数据库;11515个谱图能匹配到特有肽段;鉴定到5327个肽段,其中5045个为特有肽段序列,共鉴定到1321个蛋白质。 7.将鉴定到的所有蛋白进行了相对分子质量大小统计,统计结果显示相对分子质量大于100kDa的蛋白质数量最多,为280个;相对分子质量小于10kDa的蛋白质数量最少,仅检测到3个,其余鉴定到的蛋白相对分子质量范围在10~100kDa之间。此外,还统计了不同长度肽段占所有肽段的百分比的分布情况,其中,含11个氨基酸残基长度的肽段数量最多,约占所有肽段的12%;含22个以上和含7个以下氨基酸残基长度的肽段数量最较少,约占到所有肽段的1%;大多数肽段长度范围在9~20个氨基酸残基之间,此类长度肽段约占所有肽段的50%。进一步对鉴定到的蛋白所含肽段的数量分布情况进行了统计,仅含1个肽段的蛋白质数量最多,而且还发现大部分被鉴定到的蛋白,其所含的肽段数量在10个以内,且蛋白数量随着匹配肽段数量的增加而减少。 8.胎牛组Emb135d为对照组,成年牛组30M为实验组,两组之间进行比较,共筛选到了390个差异蛋白,其中上调表达的差异蛋白有67个,下调表达的差异蛋白有323个。进一步对差异蛋白进行了GO功能显著性富集分析,差异蛋白被显著富集到了102个与生物过程本体论相关的条目,其中大部分GO条目涉及到发育过程;12个与分子功能本体论相关的条目;21个与细胞组分本体论相关的条目。通过通路显著性富集分析,确定了差异蛋白参与的7条最主要的生化代谢途径和信号转导途径,分别涉及内质网的蛋白质加工,卵母细胞的成熟分裂,朊蛋白类疾病,链霉素生物合成,神经营养因子信号通路,柠檬酸循环,核糖体等。 9.将鉴定到的蛋白质和蛋白质直系同源簇(clusters of orthologous groups, COG)数据库进行比对进行COG注释分析,结果显示这些蛋白被归类到24个COG簇中,主要的功能涉及通用功能预测,翻译后修饰、蛋白质折叠及伴侣蛋白,翻译、核糖体结构和生物发育,能量产生和转换等。 10.通过比较390个差异蛋白和对应基因的相关性,发现了4种不同类型的蛋白和基因表达量的变化表达模式,分别是蛋白下调-基因下调(264个),蛋白上调-基因上调(61个),蛋白下调-基因上调(59个),蛋白上调-基因下调(6个);差异蛋白与基因的皮尔逊(person)相关性系数r为0.6061,呈显著正相关。此外,对所有差异蛋白及其关联转录本作了表达量关联聚类分析,发现大多数差异蛋白与其相关的转录本表达模式非常相似,极少数差异表达蛋白与其相关的转录本表达模式是相反的。 综上所述,本研究获得了高通量的牛背最长肌组织转录组和蛋白质组数据,更加全面的了解了牛背最长肌组织中基因和蛋白的表达情况,这些研究结果为阐明秦川牛肌肉发育的分子机制奠定了分子基础。
[Abstract]:The muscle development of cattle is a very complex process involving the expression of a large number of genes and the regulation of network type . At present , it is not clear that the mechanism of molecular regulation of bovine muscle development is not clear . Therefore , it is necessary to further explore the genes related to bovine muscle development and to study its function and regulation mechanism .
Using real - time quantitative PCR ( qPCR ) technique , the difference gene related to muscle development was verified by qPCR , and its expression in bovine muscle development was analyzed .
In addition , the results of the obtained proteome are correlated with the results of transcriptome . The main research contents and results are as follows :

1 . The high quality Clean Reads transcriptome data was obtained , compared with the latest cattle reference genome , the number of Reads in the fetal bovine group and the adult cattle group was 20255767 and 204 27874 , respectively , and the percentages of the reference genome of the cattle were 79.11 % and 77.92 % , respectively .

2 . A total of 6800 differentially expressed genes were screened out with a false incidence rate of 0 . 001 and no log 2 Ratio 鈮

本文编号:1824613

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/1824613.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户05163***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com