基于随机森林算法的宫颈癌淋巴结转移相关基因的生物信息学筛选
本文关键词: 随机森林算法 宫颈癌 淋巴结转移 生物信息学 出处:《中国生化药物杂志》2016年04期 论文类型:期刊论文
【摘要】:目的分析与淋巴结转移最相关的基因集和基因集中的关键节点性基因,为宫颈癌淋巴结转移预测潜在干预靶点。方法利用TCGA宫颈癌患者转录组数据集,使用随机森林算法对淋巴结转移最相关基因进行分析和排名,使用STRING和Cytospace对这些相关基因进行互作网络分析,筛选对其他基因具有最广泛相互作用的基因节点,使用DAVID对这些基因在整体上进行功能识别。结果获得淋巴结转移相关基因重要性排序(2784个),并获得其中的关键节点基因(前13位分别为EGFR,NOTCH1,RHOA),这些基因均与淋巴结转移显著相关(P0.05)。与淋巴结转移最相关的基因主要聚集在趋化因子信号通路、MAPK通路、细胞间相互作用、黏着连接、细胞骨架调控、wnt通路等。对这些有意义的宫颈癌转移相关基因集在统计学上进行了验证,获得的关键节点基因如EGFR,NOTCH1,RHOA在临床水平均已发现与宫颈癌淋巴结转移显著相关。结论随机森林算法是一个有效的方法,采用此方法获得的宫颈癌转移相关的基因集有很大比例与淋巴结转移显著相关。
[Abstract]:Objective to analyze the most relevant gene sets and the key nodal genes in the gene set for predicting potential intervention targets for lymph node metastasis of cervical cancer. Methods the transcriptome data sets of cervical cancer patients with TCGA were used. Random forest algorithm was used to analyze and rank the most relevant genes for lymph node metastasis, and STRING and Cytospace were used to analyze the interaction network of these genes. Screening of gene nodes with the most extensive interaction with other genes. DAVID was used to identify these genes as a whole. Results the sequence of importance of genes associated with lymph node metastasis was obtained (2 784). The key nodal genes were obtained (the first 13 were EGFRN NOTCH1 RHOAA). These genes were significantly correlated with lymph node metastasis (P0.05). The genes most related to lymph node metastasis were mainly located in chemokine signaling pathway, MAPK pathway, intercellular interaction and adhesion. The cytoskeleton regulates the WNT pathway and so on. These significant sets of genes associated with cervical cancer metastasis were statistically verified and the key node genes such as EGFRnNOTCH1 were obtained. RHOA has been found to be significantly associated with cervical cancer lymph node metastasis at the clinical level. Conclusion Stochastic forest algorithm is an effective method. A large proportion of the gene sets associated with cervical cancer metastasis obtained by this method were significantly correlated with lymph node metastasis.
【作者单位】: 河北省唐山市开滦总医院妇产科;国家癌症中心/中国医学科学院北京协和医学院肿瘤医院分子肿瘤学国家重点实验室;
【基金】:科技部“973”项目(2015CB553904) 国家自然科学基金(81372159;81372158)
【分类号】:R737.33
【正文快照】: 淋巴结转移是宫颈癌的主要转移途径,淋巴结转移与宫颈癌预后关联密切,淋巴结转移导致总宫颈癌患者生存率下降40%左右[1-3]。但目前对宫颈癌淋巴结转移的分子机制仍不明确。以往的研究在样本量和检测统一性、检测拓展性上大都有一定的不足,尤其是研究结果分散、难于统一和标准
【相似文献】
相关期刊论文 前10条
1 钱维;王超;吴骋;许金芳;叶小飞;杜文民;贺佳;;运用随机森林分析药品不良反应发生的影响因素[J];中国卫生统计;2013年02期
2 武晓岩;李康;;随机森林方法在基因表达数据分析中的应用及研究进展[J];中国卫生统计;2009年04期
3 李贞子;张涛;武晓岩;李康;;随机森林回归分析及在代谢调控关系研究中的应用[J];中国卫生统计;2012年02期
4 刘永春;宋弘;;基于随机森林的乳腺肿瘤诊断研究[J];电视技术;2014年15期
5 聂斌;王卓;杜建强;朱明峰;林剑鸣;艾国平;熊玲珠;;基于粗糙集和随机森林算法辅助糖尿病并发症分类研究[J];江西师范大学学报(自然科学版);2014年03期
6 武晓岩;李康;;基因表达数据判别分析的随机森林方法[J];中国卫生统计;2006年06期
7 武晓岩;闫晓光;李康;;基因表达数据的随机森林逐步判别分析方法[J];中国卫生统计;2007年02期
8 马广立;赵筱萍;程翼宇;;基于随机森林与Chemistry Development Kit描述符的P-gp底物识别[J];高等学校化学学报;2007年10期
9 苑婕;李晓杰;陈超;宋向岗;王淑美;;基于随机森林算法的川芎成分-靶点-疾病网络的预测研究[J];中国中药杂志;2014年12期
10 ;[J];;年期
相关会议论文 前8条
1 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
2 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
3 张天龙;梁龙;王康;李华;;随机森林结合激光诱导击穿光谱技术用于的钢铁分类[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
4 相玉红;张卓勇;;组蛋白去乙酰化酶抑制剂的构效关系研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
5 张涛;李贞子;武晓岩;李康;;随机森林回归分析方法及在代谢组学中的应用[A];2011年中国卫生统计学年会会议论文集[C];2011年
6 冯飞翔;冯辅周;江鹏程;刘菁;刘建敏;;随机森林和k-近邻法在某型坦克变速箱状态识别中的应用[A];第八届全国转子动力学学术讨论会论文集[C];2008年
7 曹东升;许青松;梁逸曾;陈宪;李洪东;;组合树的集合体和后向消除策略去分类P-糖蛋白化合物[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
8 张旺;范丽s,
本文编号:1460442
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/1460442.html