线粒体DNA突变与乳腺癌风险相关性研究
发布时间:2020-10-22 23:43
乳腺癌是全球女性最常见的恶性肿瘤,绝大多数系源于乳腺的上皮组织,少数可源自乳房的各种非上皮组织,偶尔可见到混合性的癌肉瘤。据Globocan统计,2008年全球女性乳腺癌新诊断病例达138万例,占全部女性恶性肿瘤发病率的23%,已成为威胁妇女健康的主要病因。目前在中国,每年有超过120万人因癌症而死亡。而乳腺癌则成为了中国女性发病率最高的癌症,在癌症死亡原因中位居第六;中国每年乳腺癌新发数量和死亡数量分别占全世界的12.2%和9.6%。中国全年检查出的乳腺癌患者数量是欧洲的一半,与美国基本相当。在过去30至40年中,恶性肿瘤死亡率在城市人群中的增长速度远远高于农村。如果保持这一趋势不变,那么到2021年,中国乳腺癌患者将会高达250万,发病率可能将会增加一倍。为此,我国在2012年启动了城市癌症早诊早治项目,拟在全国9个大区的14个省份针对城市高发的五大类癌症(肺癌、结直肠癌、上消化道癌、乳腺癌和肝癌)开展危险因素调查和高危人群评估、癌症筛查和卫生经济学评估工作。乳腺癌是一种全身性的疾病,在疾病的早期就有可能发生肿瘤细胞的全身扩散。乳腺癌治疗失败的原因几乎为复发和转移,其主要转移途径为血行播散,乳腺癌细胞可以通过上述途径到达机体的任一组织和器官,并在一定条件下形成转移灶。一般肿瘤在小于1 cm的情况下,医生并不会认为它是异常。但通过国外发表的文章可知,不要说是1 cm,很多肿瘤在1 mm的情况下就能够在血液里检查到循环肿瘤细胞。因此对于早期诊断来讲,乳腺癌高危因素的预测并通过日常生活中有效的预防,就显得更加有意义。正因为如此,很多研究者都投身于乳腺癌的研究,试图用各种方法找到乳腺癌的发病机制。一些乳腺癌高发病率国家对乳腺癌发病相关危险因素的研究已经取得重大进展。研究者通过对某一地区特定人群的调查与分析,确定了这一区域乳腺癌发病相关危险因素。从而让医生能够对相关信息进行个体化、量化来预测某一女性罹患乳腺癌危险性。这已经成为恶性肿瘤相关检查的重要内容。乳腺是多种内分泌激素的靶器官,如雌激素、孕激素及泌乳素等。雌激素是乳腺细胞增殖最主要的兴奋剂,黄体酮(孕酮)也会一同作用加大乳腺细胞增殖的比率。其中雌酮及雌二醇对乳腺癌的发病有直接关系。20岁前本病少见,20岁以后发病率迅速上升,45-50岁较高,绝经后发病率继续上升,可能与年老者雌酮含量提高相关。月经初潮年龄早、绝经年龄晚、不孕及初次足月产的年龄与乳腺癌发病均有关。一级亲属中有乳腺癌病史者,发病危险性是普通人群的2-3倍。乳腺良性疾病与乳腺癌的关系尚有争论,多数认为乳腺小叶上皮高度增生或不典型增生者可能与乳腺癌发病有关。另外,营养过剩、肥胖、脂肪饮食,可加强或延长雌激素对乳腺上皮细胞的刺激,从而增加发病机会。北美、北欧地区乳腺癌发病率约为亚、非、拉美地区的4倍,而低发地区居民移居至高发地区后,第二、三代移民的乳腺癌发病率逐渐升高,提示环境因素及生活方式与乳腺癌的发病有一定关系。除此之外,随着近年来对基因突变与癌症发生相关研究的不断突破和深入,人们越来越认识到癌症的发生与基因突变紧密相关。研究者纷纷进行了大量的关于癌症发生在基因水平方面的机制研究,取得了丰硕的成果,并且逐渐应用于癌症的诊断、预防当中。尤其是随着人类测序计划和Hap Map计划的顺利完成,各种高通量测序技术、基因芯片技术的广泛应用,研究者可以利用全基因组关联性分析的方法来寻找乳腺癌的易感基因。上世纪80年代,流行病学家克莱尔·金通过分析家族聚集性乳腺癌病例,认为17号染色体的某个基因可能是导致乳腺癌的主要原因。1994年,美国MYRIAD公司在此基础上顺利地找到了BRCA1,同年该公司又利用冰岛的两个乳腺癌高发家族提供的样本,在13号染色体上找到了BRCA2基因。目前为止,已发现的BRCA基因突变已达到数百种之多。但其仅限于有强烈遗传家族史的人群,包括40岁之前的一级亲属患乳腺癌,50岁之前患双侧乳腺癌,任何年龄2个或2个以上一级亲属患乳腺癌。筛查较高频率的突变形式,或对外显子11进行筛查,也有筛查全部外显子和邻近内含子的全序列监测法。但是癌症是多因素疾病,乳腺癌中BRCA只能解释与一部分的癌症之间的关联,且存在漏洞的可能性。因此,在判断结果时必须综合分析。于此同时,还应寻找其他与乳腺癌发生相关的分子机制,并可应用于高发人群的筛查、评估的标准。这对于乳腺癌的早期预测、有效预防十分必要。虽然目前高通量测序的成本已降低了不少,但是全面开展全基因组关联分析这种需要巨大样本量和测序通量的研究需要比较高的成本。因此本课题将研究的目标锁定在线粒体基因组。人线粒体DNA (mitochondrial deoxyribonucleic acid, mtDNA)是含有16.6kb的闭环双链分子,有轻链和重链之分。线粒体DNA是真核细胞中唯一存在的独立于核DNA之外的遗传物质,与细胞的氧化磷酸化功能密切相关。它编码氧化磷酸化(oxidative phosphorylation, OXPHOS)所需的13种氧化磷酸作用酶亚基,包括复合物Ⅰ中的七个亚基(ND1, ND2, ND3, ND4, ND4L, ND5, ND6),复合物Ⅲ中的一个亚基(CytB),复合物Ⅳ中的三个亚基(COX1,COX2, COX3)以及复合物Ⅴ中的两个亚基(ATPase6,ATPase8);同时,mtDNA还可以编码合成蛋白和生成ATP必需的22种tRNAs和两种rRNAs。mtDNA无内含子,唯一的非编码区为D-loop区(displacement-region, D-loop region),该区已被证实为mtDNA复制转录的调控区,含有基因复制起点和负责转录调控的启动子区。虽然mtDNA有自我复制能力,但产能过程中所需要的大多数蛋白仍然是由细胞核基因组(nuclear deoxyribonucleic acid, nDNA)所编码的,因此称线粒体为半自主性复制的细胞器。过去十多年的研究发现mtDNA的突变率很高,比nDNA高出几十倍,突变类型有:大片段缺失、错义突变、移码突变以及小片段的缺失和插入等。这主要是由其自身的结构和功能特点决定的,这也导致它成为了众多致癌物作用的重要靶点。mtDNA的突变可削弱正常的呼吸功能,释放高水平的ROS,进而增加肿瘤发生的危险性,所以mtDNA被认为与肿瘤发生有密切关系。许多学者已经证实检测肿瘤细胞中的mtDNA突变比检测nDNA突变要简便可靠。临床上针对核基因损伤的肿瘤检测结果常达不到预期的效果,这是因为受到了野生型nDNA的干扰,而mtDNA在细胞中的拷贝数比nDNA高得多,比如在肿瘤细胞中突变mtDNA的拷贝数比p53基因的拷贝数高200多倍,因此检测mtDNA突变更可靠。本研究的目的在于对乳腺癌患者人群外周血中的mtDNA突变进行全基因组关联性分析来筛选具有高风险的种系突变。区别于以往研究中采用乳腺癌组织分析的体细胞突变,种系突变对于乳腺癌高风险人群的预测、乳腺癌的预防和早期无创诊断方面有着更大的意义。本研究的实验方法为通过随机采集对照组(进行全面体格检查和影像学检查排除各种肿瘤的体检者)和病例组(首次病理确诊为乳腺癌且从未进行过治疗的患者)外周血样本,获得对照组样本137例,病例组样本118例。提取总DNA后通过两段扩增法富集mtDNA,构建片段长度为200bp的高通量测序文库。通过Agilent 2100和Qubit 2.0对构建好的文库进行浓度、片段大小的测定,对文库质量进行评估,确定用于测序模板制备的文库量。在Ion One Touch 2平台上进行测序模板的制备、富集后,使用Ion 316芯片在Ion torrent PGM测序仪上进行高通量测序。测序数据运用Ion Torrent PGM服务器系统Torrent Suite4.2自带的分析软件FastQC-3.4.1.1、Assembler-3.4.2.0、Alignment2.0,coverageAnalysis 3.0软件进行测序质控和结果分析,对测序数据进行初步分析,去除接头、低质量,多克隆的序列,对原始序列进行组装,获得整体数据量、平均测序深度、测序质量等数据信息,导出测序fastq格式的原始数据和测序报告。运用基于fanse2算法的云平台,与参考Homo sapiens GRCh38基因组(NC_012920)序列进行比对,进行变异位点分析及基因注释,获得每个样本的突变列表。对每个突变的样本数进行统计,计算突变频率=有突变样本数/总样本数。运用SPSS19.0统计学分析软件对突变频数进行四格表资料的卡方检验法分析对照组和病例组之间的差异性,同时进行相对风险性评估,计算OR值(Odds Ratio,OR)和95%可信区间(95% confident Internal,95% CI),结合卡方检验p值,分析SNP与乳腺癌疾病的关联性,筛选高风险评价指标。筛除滤过率低于40%、mapping率低于80%、覆盖深度低于100X或覆盖度不均一的样本数据,最终筛选得到对照组22例和实验组83例有效数据,平均覆盖深度达到300X以上。测序数据分析结果表明,在22例对照组的mtDNA中发现170个突变位点,而在83例乳腺癌患者的mtDNA中发现393个突变位点;我们搜索到的所有突变中有283个是未有报道的,其中实验组含有232个,对照组含有88个。关联性分析结果表明其中32个突变具有显著性差异。这32个突变分布于mtDNA的D-loop区(4/32)、编码区的RNR2(1/32)、COX1 (8/32)、 COX2 (3/32)、ATP6 (1/32)、COX3 (4/32)、ND4 (3/32)、ND5 (4/32)和CYTB(2/32)。对这些突变位点的相对风险性分析发现,27个突变的OR值小于1,即为保护因素,可降低乳腺癌发病的机率。而另外5个,即位于编码区RNR2的2463位上的indelA、位于COX1的6296位上的CA、6298位上的indelT、位于ATP6的8860位上的AG和位于ND5的13327位上的indelA,这些位点的OR值大于1,分别为8.050、4.464、4.464、5.254、4.853,即表明这些突变可能提高乳腺癌发病的机率,为高风险因素。MT-RNR2是线粒体编码的16srRNA,隶属于Mt-rRNA家族,参与线粒体独立的核糖体组装。2463A位点的缺失可能使其结构发生变化,影响其与其他蛋白或核酸的结合。作为线粒体独立转录翻译系统中重要的部件,其功能的丧失将直接影响到其他蛋白质的合成,使整个线粒体的功能受到极大的影响。MT-COX1是在线粒体中合成的细胞色素c氧化酶中的1个亚基,是具有催化功能的重要单元。虽然COX1上的C6296T是一个无义突变,但是在研究中我们却发现COX1上的C6296T点突变和6298T位点缺失突变总是同时出现,其中的原因未知,而6298T的缺失突变却可能造成编码区的移码突变,从而改变整条肽链的氨基酸序列。COX1作为细胞色素c氧化酶上重要的催化功能亚基,它的结构改变将直接导致细胞色素c氧化酶催化功能的丧失。MT-ATP6编码“生物分子马达"ATP合成酶的一个亚基。在MT-ATP6编码区的点突变A8860G使原来的极性氨基酸苏氨酸(ACA)突变成非极性的丙氨酸(GCA),这必然会引起蛋白质三级结构的改变,从而影响ATP合成酶的催化活性。MT-ND5编码NADH脱氢酶(复合物Ⅰ)中的第五个亚基。13237A位点的缺失将使编码区发生移码突变,整条多肽链的氨基酸序列都将发生错义突变,因此蛋白质二级、三级结构发生变化,从而影响NADH脱氢酶复合物的功能。上述5个mtDNA突变均可能影响呼吸链的合成,通过nDNA与mtDNA基因相互调控,也将使核基因突变几率增大以及引起细胞凋亡紊乱,对乳腺癌发生和发展可能起着十分重要的作用。与以往的研究不同,本课题主要针对mtDNA的种系突变与乳腺癌的关系进行研究,分析结果得到的5个突变有可能作为乳腺癌高风险人群评估的指标之一,以达到早期预防的效果。而样本采用外周血,其研究成果在将来也可以直接应用于无创诊断技术当中。由于时间的限制,本研究只采集了255例的样本,而mtDNA的高通量测序在国内尚未见报道,通过本课题已建立起较完善的技术流程,但在摸索过程中,部分样本的测序质量不太理想,为了保证关联性分析结果的科学性和可靠性,将测序数据进行了严格的筛选,最终只得到了22例对照组和83例乳腺癌病例组的mtDNA数据用于关联性分析。今后的研究将进一步扩大范围,采集全国各地的样本用于mtDNA全基因组关联性分析。本研究中筛选得到的5个突变也将在更大规模的研究中进一步验证。
【学位单位】:南方医科大学
【学位级别】:博士
【学位年份】:2015
【中图分类】:R737.9
【部分图文】:
.-50ng心L,?50ul,符合文库构建模板浓度要求。1%琼脂糖凝胶电泳,120V,?30min。??在7287bp和939化P处有目的亮条带,符合预期要求,表明mtDNA捕获成功(见??图?4、?5)。??
率低于80%、覆盖深度低于100X或覆盖度不均一的样本数据,最终筛选得到??对照组22例和病例组83例有效数据,样品的数据量足够可W将基因组的位点??全覆盖(见图9A),平均覆盖深度达到300X?W上(见图犯),这些数据将用??于突变位点与现腺癌疾病的关联性分析。??■?COV:?B1?林L300*"frS"-M1??2500-1?1?1?1?1?1?1?1?1—??田?2000?H?J?1??r??I?i画面云因面面圃??0?2000?4000?6000?8000?10000?12000?14000?16000??Pos也on?(nt)??A??。500?I?'?' ̄ ̄'?'?'?'?'?'?'?'?'?'?'?'?'?'?'?'?'??咖M咖iliil??1?2?3?4?5?6?7?8?9?10?11?12?13?14?巧化1718?巧?20??sample?#??B??图9部分样品线粒体基内组薇盖度(A)和平均禮盖深度统计图巧)??Figure?9?Coverage?(A)?and?Average?Coverage?Dep比(B)?of?Mitochondrial?Genome??65??
.-50ng心L,?50ul,符合文库构建模板浓度要求。1%琼脂糖凝胶电泳,120V,?30min。??在7287bp和939化P处有目的亮条带,符合预期要求,表明mtDNA捕获成功(见??图?4、?5)。??
本文编号:2852241
【学位单位】:南方医科大学
【学位级别】:博士
【学位年份】:2015
【中图分类】:R737.9
【部分图文】:
.-50ng心L,?50ul,符合文库构建模板浓度要求。1%琼脂糖凝胶电泳,120V,?30min。??在7287bp和939化P处有目的亮条带,符合预期要求,表明mtDNA捕获成功(见??图?4、?5)。??
率低于80%、覆盖深度低于100X或覆盖度不均一的样本数据,最终筛选得到??对照组22例和病例组83例有效数据,样品的数据量足够可W将基因组的位点??全覆盖(见图9A),平均覆盖深度达到300X?W上(见图犯),这些数据将用??于突变位点与现腺癌疾病的关联性分析。??■?COV:?B1?林L300*"frS"-M1??2500-1?1?1?1?1?1?1?1?1—??田?2000?H?J?1??r??I?i画面云因面面圃??0?2000?4000?6000?8000?10000?12000?14000?16000??Pos也on?(nt)??A??。500?I?'?' ̄ ̄'?'?'?'?'?'?'?'?'?'?'?'?'?'?'?'?'??咖M咖iliil??1?2?3?4?5?6?7?8?9?10?11?12?13?14?巧化1718?巧?20??sample?#??B??图9部分样品线粒体基内组薇盖度(A)和平均禮盖深度统计图巧)??Figure?9?Coverage?(A)?and?Average?Coverage?Dep比(B)?of?Mitochondrial?Genome??65??
.-50ng心L,?50ul,符合文库构建模板浓度要求。1%琼脂糖凝胶电泳,120V,?30min。??在7287bp和939化P处有目的亮条带,符合预期要求,表明mtDNA捕获成功(见??图?4、?5)。??
本文编号:2852241
本文链接:https://www.wllwen.com/yixuelunwen/zlx/2852241.html