当前位置:主页 > 医学论文 > 肿瘤论文 >

基于网络数据库及WGCNA-LASSO算法胃癌预后lncRNA分子标志物筛选

发布时间:2021-06-28 16:37
  目的基于网络数据库中胃癌和癌旁组织的RNA测序数据及临床特征数据,运用系统生物学方法联合机器学习算法进行生物信息学分析,筛选出胃癌预后长链非编码RNA(long noncoding RNA,lncRNA)分子标志物,为研究胃癌发生发展的分子学机制提供参考。方法1从癌症基因组图谱官网下载胃癌和癌旁组织RNA测序数据及临床特征数据,提取lncRNA数据并进行标准化处理,运用“edge R”函数包筛选胃癌差异表达lncRNA,采用加权基因共表达网络分析(Weighted Gene Correlation Network Analysis,WGCNA)鉴定与胃癌总体生存时间相关的lncRNA模块。2运用最小化绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator,LASSO)算法对模块内lncRNA构建胃癌预后lncRNA模型,绘制受试者工作特征曲线(Receiver Operating Characteristic,ROC)并计算曲线下面积(Area Under Curve,AUC)评价模型。根据模型计算胃癌和癌旁样本对应的风险评分... 

【文章来源】:华北理工大学河北省

【文章页数】:75 页

【学位级别】:硕士

【部分图文】:

基于网络数据库及WGCNA-LASSO算法胃癌预后lncRNA分子标志物筛选


鉴定胃癌预后lncRNA模块的研究步骤图

数据分布,胃癌,火山,临床特征


-8-II127(30%)12(37%)III199(64%)20(63%)X9(3%)0(0%)表1中包含5个临床特征,其中1个临床特征属于等级数据,即病理分级(Grade),分为病理I级、病理II级、病理III级,分级不能明确的则划分为病理X级;其中2个临床特征数据属于分类数据,即性别(男/女)、生存状态(存活/死亡);年龄(≥65岁/<65岁)和总体生存时间(≥2000天/<2000天,5年近似于2000天)这2个临床特征数据为连续性数值数据。“chisq.test()”函数对胃癌和癌旁组织样本基线特征进行卡方(χ2)检验,发现在性别、年龄、总体生存时间、最终生存状态及病理分级方面胃癌和癌旁组织样本之间P值均大于0.05,差异不具有统计学意义。结果提示研究纳入特征与胃癌组织与否无明显相关性,该数据分布进行胃癌预后lncRNA分子标志物的筛选研究较为合理。1.2.2筛选胃癌差异表达lncRNA针对预处理得到的14448个lncRNA表达数据,运行“edgeR”函数包进行胃癌差异表达lncRNA的筛选,并绘制胃癌差异表达lncRNA火山图(图2)。本研究共筛选得到3301个胃癌差异表达lncRNA,其中有2439个lncRNA表达上调(红色),862个lncRNA表达下调(绿色)。图2胃癌差异表达lncRNA火山图

聚类,胃癌,红线


-9-将edgeR函数筛选所得胃癌差异表达lncRNA对应统计量进行汇总,按所得P值从小到大进行排序,一般认为P值越小代表差异表达性越显著,依据P值选择差异表达最显著的前10个lncRNA,并列表如表2。表2胃癌差异表达最显著前10个lncRNAIndexGeneIDLogFCLogCPMP-ValueFDR1IL12A.AS1-3.625.041.17e-621.25e-582ADAMTS9.AS1-2.996.503.43e-511.82e-473RP11-867G23.10-3.326.134.63e-461.64e-424RP11-770J1.3-1.985.481.39e-443.69e-415AL928768.3-4.006.847.19e-441.53e-406AF131217.1-2.755.439.30e-421.65e-387AC090616.2-2.305.941.26e-401.92e-378RP11-613D13.8-2.554.876.16e-388.19e-359AC067959.1-3.843.337.87e-389.32e-3510HCG22-4.667.273.00e-373.20e-341.2.3构建加权基因共表达网络以动态剪切树法进行聚类分析,选取剪切高度50000为标准进行剪切,保留高度较为一致的数据,绘制聚类图(如图3)。红线代表剪切高度50000,红线以上代表去除数据,去除4例胃癌样本数据,保留红线以下的373例胃癌和癌旁组织样本数据进行加权基因共表达网络的构建。图3聚类图

【参考文献】:
期刊论文
[1]中国胃癌发病趋势及预测[J]. 杨之洵,郑荣寿,张思维,曾红梅,陈万青.  中国肿瘤. 2019(05)
[2]颅内动脉瘤相关基因的共表达网络构建与分析[J]. 廖宝,周凤坤,钟松辛,周远方,覃燕生,周梦晓,秦超.  中华医学杂志. 2019 (07)
[3]基于癌症基因组图谱构建胃癌预后评估模型[J]. 王举,窦忠霞,姜洪伟,王永强,高小平,张勇.  天津医药. 2018(12)
[4]胃癌分子标志物在临床中的研究进展[J]. 丽敏,刘险峰,孙鲁山,王虎明.  中国医学工程. 2018(09)
[5]肺癌关键基因筛选及预测模型的研究[J]. 潘以红,范雪萌,朱平.  生物学杂志. 2019(02)
[6]残胃癌淋巴结转移的高危因素分析及预测模型的建立[J]. 王玮,聂润聪,周志伟.  中华胃肠外科杂志. 2018 (05)
[7]中国早期胃癌筛查流程专家共识意见(草案)(2017年,上海)[J]. 杜奕奇,蔡全才,廖专,方军,朱春平.  胃肠病学. 2018(02)
[8]利用转录组测序数据分析胃癌长链非编码RNA的研究[J]. 曹伟军,谈路轩,李超,韩维维,张军,张振玉.  临床肿瘤学杂志. 2017(12)
[9]早期胃癌患者淋巴结转移危险因素分析及风险预测模型的建立[J]. 韩文秀,徐阿曼,陈章明,韦之见,刘虎.  中华普通外科杂志. 2017 (04)
[10]中国胃癌流行病学现状[J]. 左婷婷,郑荣寿,曾红梅,张思维,陈万青.  中国肿瘤临床. 2017(01)



本文编号:3254673

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/zlx/3254673.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d804a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com