Connectivity Map数据库中受不同数目药物调控的基因集比较
发布时间:2021-08-25 06:21
随着医学科学技术的不断发展,人类的医学经历了由经验医学到循证医学的演化。而生物科学的进步,更是将医学推进到了当下火热的精准医学阶段。基因作为表达人们性状的蛋白质的基本组成单位,在精准医学的研究中有着至关重要的地位,同时,基因芯片和高通量测序的发展为研究不同状态下(如用药及对照,癌症及癌旁)全基因组范围内的差异提供了强有力的工具。基因的表达在很大程度上受到药物的调控,可以受多种药物调控的基因相对于仅能受非常少药物或者是不受药物调控的基因在特性和功能上可能会有非常大的差异,对这两种类型的基因进行综合的比较分析将有助于我们筛选疾病潜在的治疗靶标以及在疾病的副作用中起重要作用的基因。Connectivity Map(CMAP)数据库由特有的基因组表达谱组成,包括1309种作用机制已知的具有生物活性的小分子处理人类细胞系后的全基因组表达谱。本次研究中,针对CMAP数据库中检测了表达值的基因,我们统计其在用不同的小分子处理前后发生了差异表达的次数(DEN),在进化和功能等不同层面比较了差异表达次数多的基因相对于差异表达次数少的基因之间的差异。我们的研究结果表明,用不同的小分子处理后相对于未处理时的...
【文章来源】:天津医科大学天津市 211工程院校
【文章页数】:113 页
【学位级别】:博士
【部分图文】:
CMAP数据库的工作原理
图 2 本研究的流程图。DEN 是 differential expression number 的缩写,即在 CMAP 中的差异表达次数。Wilcoxon 检验[33]是由威尔科克森与 1945 年提出来的,它不要求检验数据呈正态分布,把观测值和零假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量,所以 Wilcoxon 检验是 t 检验不适用的非正态分布的变量的较好的检验方法。并且,为了探索对药物应答敏感性不同的基因集在基因组上各自之间的距离的差异,我们首先计算了 down_h,down_l,up_h,up_l 基因集中两两基因之间的染色体距离(即两基因位于同一染色体上时,两基因的开始或者是截尾之间间隔的碱基数),并且利用 Wilcoxon检验对 down_h 及 down_l 之间和 up_h及up_l 之间的染色体距离差异显著性进行了检验,以探索对药物应答较敏感的基因在基因组上是否更倾向于聚集在一起。1.3 组织特异性表达分析在器官和组织空间水平上对人类蛋白质的表达进行归类分析对人类生物学和疾病的研究是至关重要的[34],现在有非常多的数据库存储了基因或者蛋白的
天津医科大学博士学位论文 结果结果2.1 CMAP 中基因差异表达次数的分布CMAP 数据库中存储了 1309 种有生物活性的小分子处理人类 MCF7,ssMCF7 , PC3 , HL60 和 SKMEL5 细胞系后的基因表达谱数据,基于Affymetrix Human Genome U133A 芯片进行检测基因表达值,共包含了 2214个探针(对应 12637个基因)。我们利用 limma函数包求了每个小分子处理细胞系后相对于处理前的差异倍数,这样总的得到了 6101 个差异倍数,形成了12637 行 6101 列的矩阵,矩阵的行代表基因,列代表小分子处理细胞系后的样本,矩阵中的数值代表差异倍数。差异倍数矩阵的部分例子见图 3。以差异倍数大于 2(小分子处理后相对于处理前高表达)或小于 0.5(小分子处理后相对于处理前低表达)作为差异表达的阈值,我们统计了每个基因的显著上调和显著下调的次数。图 4展示了所有基因的显著下调次数和显著上调次数的分布。
【参考文献】:
期刊论文
[1]MiRNA as potential biomarkers and therapeutic targets for gastric cancer[J]. Vivian Yvonne Shin,Kent-Man Chu. World Journal of Gastroenterology. 2014(30)
[2]Effects of SNPs at Newly Identified Lipids Loci on Blood Lipid Levels and Risk of Coronary Heart Disease in Chinese Han Population:A Case Control Study[J]. 壮可,张文才,张晓博,吴芳琴,程龙献. Journal of Huazhong University of Science and Technology(Medical Sciences). 2011(04)
本文编号:3361576
【文章来源】:天津医科大学天津市 211工程院校
【文章页数】:113 页
【学位级别】:博士
【部分图文】:
CMAP数据库的工作原理
图 2 本研究的流程图。DEN 是 differential expression number 的缩写,即在 CMAP 中的差异表达次数。Wilcoxon 检验[33]是由威尔科克森与 1945 年提出来的,它不要求检验数据呈正态分布,把观测值和零假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量,所以 Wilcoxon 检验是 t 检验不适用的非正态分布的变量的较好的检验方法。并且,为了探索对药物应答敏感性不同的基因集在基因组上各自之间的距离的差异,我们首先计算了 down_h,down_l,up_h,up_l 基因集中两两基因之间的染色体距离(即两基因位于同一染色体上时,两基因的开始或者是截尾之间间隔的碱基数),并且利用 Wilcoxon检验对 down_h 及 down_l 之间和 up_h及up_l 之间的染色体距离差异显著性进行了检验,以探索对药物应答较敏感的基因在基因组上是否更倾向于聚集在一起。1.3 组织特异性表达分析在器官和组织空间水平上对人类蛋白质的表达进行归类分析对人类生物学和疾病的研究是至关重要的[34],现在有非常多的数据库存储了基因或者蛋白的
天津医科大学博士学位论文 结果结果2.1 CMAP 中基因差异表达次数的分布CMAP 数据库中存储了 1309 种有生物活性的小分子处理人类 MCF7,ssMCF7 , PC3 , HL60 和 SKMEL5 细胞系后的基因表达谱数据,基于Affymetrix Human Genome U133A 芯片进行检测基因表达值,共包含了 2214个探针(对应 12637个基因)。我们利用 limma函数包求了每个小分子处理细胞系后相对于处理前的差异倍数,这样总的得到了 6101 个差异倍数,形成了12637 行 6101 列的矩阵,矩阵的行代表基因,列代表小分子处理细胞系后的样本,矩阵中的数值代表差异倍数。差异倍数矩阵的部分例子见图 3。以差异倍数大于 2(小分子处理后相对于处理前高表达)或小于 0.5(小分子处理后相对于处理前低表达)作为差异表达的阈值,我们统计了每个基因的显著上调和显著下调的次数。图 4展示了所有基因的显著下调次数和显著上调次数的分布。
【参考文献】:
期刊论文
[1]MiRNA as potential biomarkers and therapeutic targets for gastric cancer[J]. Vivian Yvonne Shin,Kent-Man Chu. World Journal of Gastroenterology. 2014(30)
[2]Effects of SNPs at Newly Identified Lipids Loci on Blood Lipid Levels and Risk of Coronary Heart Disease in Chinese Han Population:A Case Control Study[J]. 壮可,张文才,张晓博,吴芳琴,程龙献. Journal of Huazhong University of Science and Technology(Medical Sciences). 2011(04)
本文编号:3361576
本文链接:https://www.wllwen.com/yixuelunwen/jichuyixue/3361576.html