基于特征提取方法的p53家族基因信息表达及分析
本文选题:p53家族基因 + CGR ; 参考:《江南大学》2017年硕士论文
【摘要】:p53基因是迄今为止发现与肿瘤相关性最高的基因,家族成员p63、p73在结构和功能上与其具有很高的同源性,因此如何使用有效的数学方法挖掘更准确的p53家族的生物信息,将对肿瘤的预防和控制具有重要意义。本文以p53家族的mRNA完整CDS序列为研究对象,采用特征提取方法对序列的表达信息进行识别,并运用层次聚类分析方法对p53家族基因序列进行分析。具体工作概括如下:(1)基因签名是一种新兴的基于特征提取的基因表达信息识别方法,能够有效的识别基因的一些生物信息。本文在原基于CGR方法的基因签名上,引入具有一定物理特性的核苷酸游离电子平均能量(EIIP),建立了一种新的E基因签名方法。同时,定义两序列间的E欧氏距离及e均方差公式,并对相关物种进行层次聚类分析。通过对16个物种的p53家族基因mRNA完整CDS序列进行E基因签名得出,在每种基因中均有物种关系越近,基因签名相似度越高的结论。(2)除了根据CGR图形构造原理进行基因签名外,本文还利用CGR方法构造一个12维特征向量对mRNA序列进行数值刻画,并定义了欧氏距离为序列间的距离。再依据此欧氏距离对16个物种的p53家族基因序列进行层次聚类分析,并将聚类结果与原来仅利用8维特征向量得到的聚类结果作对比,发现使用12维特征向量刻画基因序列的方法更合理。(3)为避免序列有效信息的丢失,综合序列CGR游走,平均功率谱,EIIP值和碱基实数化4个特征指标,建立一种多指标物种相似性分析方法,并对多个物种的p53家族基因的mRNA序列作出聚类谱系图进行层次聚类分析。聚类结果与实际相符,说明使用四重特征指标方法对基因序列进行刻画,能够较全面反映序列的生物信息。
[Abstract]:P53 gene is the gene most closely related to tumor so far. The family member p63 p73 has high homology in structure and function, so how to use effective mathematical method to mine more accurate biological information of p53 family. It will be of great significance to the prevention and control of tumor. In this paper, the mRNA complete CDS sequence of p53 family is taken as the research object, the expression information of the sequence is identified by feature extraction method, and the p53 family gene sequence is analyzed by hierarchical cluster analysis. The specific work is summarized as follows: (1) Gene signature is a new method of gene expression information recognition based on feature extraction, which can effectively recognize some biological information of gene. In this paper, based on the CGR method, a new E gene signature method is established by introducing the nucleotide free electron mean energy (EIIP) with certain physical characteristics. At the same time, the E Euclidean distance and the e mean square error formula between the two sequences are defined, and the related species are analyzed by hierarchical clustering. Based on the E gene signature of mRNA complete CDS sequence of p53 family gene from 16 species, it is concluded that the closer the species relationship is in each gene, the higher the similarity of gene signature is. In this paper, the CGR method is used to construct a 12-dimensional eigenvector to characterize the mRNA sequence, and the Euclidean distance is defined as the distance between the sequences. Based on the Euclidean distance, the p53 family gene sequences of 16 species were analyzed by hierarchical cluster analysis, and the results were compared with those obtained by using only 8-dimensional eigenvector. It is found that it is more reasonable to use 12-dimensional eigenvector to depict gene sequences. In order to avoid the loss of effective information of sequences, we found that the synthetic sequence CGR walks, the average power spectrum of EIIIP values and the real number of bases are converted into four characteristic indexes, so as to avoid the loss of effective information of the sequences. A multi-index species similarity analysis method was established, and the mRNA sequences of p53 family genes of multiple species were analyzed by hierarchical cluster analysis. The clustering results are consistent with the actual results, which shows that the method of quadruple characteristic index can reflect the biological information of the sequence completely.
【学位授予单位】:江南大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:Q811.4
【相似文献】
相关期刊论文 前10条
1 王崇高;陈吉祥;胡升庠;赵新潮;卢明;;RAS相关结构家族基因1克隆及序列分析[J];医学研究生学报;2009年09期
2 王玉红;徐立华;李军;;玉米TCP家族基因生物信息学鉴定与分析[J];山东农业科学;2014年04期
3 白英男;冯丹丹;林军岳;冯娟;任正隆;;GAST家族基因及蛋白研究进展[J];生物技术通报;2011年11期
4 陈宣茂,孙朝辉,应康,谢毅;Rab家族基因的背景资料[J];云南大学学报(自然科学版);1999年S3期
5 ;父母都偏心[J];大科技(百科新说);2014年03期
6 孙洪波;贾贞;韩天富;;PEBP家族基因在植物发育调控中的作用[J];植物生理学通讯;2009年08期
7 朱岩;彭振英;张斌;毕玉平;;PEBP家族基因在植物中功能的研究进展[J];山东农业科学;2013年02期
8 王其强;谈承杰;晏寒冰;朱平;;基于碱基三周期性研究P53家族基因的特征[J];生物物理学报;2013年04期
9 周莲洁;张富春;王艳;;GRAS家族基因在植物生长、代谢及逆境胁迫中的功能研究进展[J];植物生理学报;2013年09期
10 段龙飞;慕小倩;李文燕;;茉莉酸信号途径中转录抑制因子JAZ蛋白家族的分子进化分析[J];植物学报;2013年06期
相关会议论文 前8条
1 郭静;韩生成;;烟草JAZ家族基因的克隆及功能分析[A];2009中国植物学会植物细胞生物学学术年会论文摘要集[C];2009年
2 张文正;邹俊杰;宋莲芬;马淑英;李群;武维华;;拟南芥CPK家族基因功能初步研究[A];中国遗传学会植物遗传与基因组学专业委员会2005年学术研讨会论文摘要集[C];2005年
3 周晓今;李洁;程伟;刘海;李萌萌;张元;李文博;韩生成;王英典;;水稻ADP核糖基化因子(OsARF)家族基因的预测和表达研究[A];2009中国植物学会植物细胞生物学学术年会论文摘要集[C];2009年
4 黄贝;聂品;齐志涛;徐镇;;脊椎动物干扰素调节因子(IRF)家族基因起源进化初探[A];2008年中国水产学会学术年会论文摘要集[C];2008年
5 李文林;杨国宇;李宏基;郭豫杰;鲁维飞;;猪Reg家族基因的克隆与原核表达[A];全国动物生理生化第十一次学术交流会论文摘要汇编[C];2010年
6 丰胜求;夏涛;甘莉;陈小冬;雷霆;杨在清;;猪Angptl家族基因的克隆、表达及调控研究[A];湖北省暨武汉市生物化学与分子生物学学会第八届第十七次学术年会论文汇编[C];2007年
7 田望;侯聪聪;李乐攻;;OsHKT1;1和OsHKT1;5(SKC1)的电生理特性和调节[A];中国植物生理学会第十次会员代表大会暨全国学术年会论文摘要汇编[C];2009年
8 李敏;郭迟鸣;张玉霞;赵婷婷;崔欣欣;王换乐;陈亮;;DUF1644家族基因SIDP364&SIDP361在盐胁迫应答中的功能研究[A];全国园艺植物生长繁育技术及应用研讨会论文集[C];2012年
相关博士学位论文 前2条
1 李秋苹;OsHAP家族基因的功能研究和粒形基因GL3.2的图位克隆[D];华中农业大学;2016年
2 金丹;猪Sirtuin家族基因的克隆及脂肪生成中SIRT3的功能研究[D];华中农业大学;2013年
相关硕士学位论文 前10条
1 张超;84K杨HD2亚家族基因的克隆与表达分析[D];东北林业大学;2015年
2 Nguyen Thi Hung(阮氏兴);小麦IQD家族基因的克隆及功能研究[D];西北农林科技大学;2015年
3 沈雷定;MiR156家族基因在柑橘阶段发育以及成花调控中的作用[D];华中农业大学;2015年
4 王燕;飞蝗表皮蛋白Obstructor家族基因的分子特性及功能研究[D];山西大学;2015年
5 颜丽美;GIS家族基因调控拟南芥开花的分子作用机制的初步研究[D];浙江大学;2014年
6 韩小东;高粱ERECTA家族基因的克隆及其干旱胁迫相对表达水平的分析[D];江西农业大学;2015年
7 姚文;福州若干野生蕉ISSR分析、离体繁殖及APX克隆与表达分析[D];福建农林大学;2015年
8 陈兰平;甘蔗蔗糖磷酸合成酶家族基因演化和功能研究[D];福建师范大学;2015年
9 潘舒;水稻OsTHE1家族基因结构与功能的研究[D];华中农业大学;2013年
10 田丽梅;番茄IMPα/β和LYK家族基因的鉴定、表达模式分析和功能研究[D];浙江大学;2016年
,本文编号:1881333
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/1881333.html