背景和目的结直肠癌(Colorectal cancer,CRC)是我国发病率第3的消化系统恶性肿瘤,易复发转移,目前尚无特异性的治疗方法,患者远期预后差。利用生物学标志物早期筛查和确诊CRC,是提高患者存活率,改善预后的关键。发现和鉴定对CRC有特异性诊断价值的生物学标志物,对于查明CRC的发病机制,研发新的治疗举措和新型药物,推动CRC的诊疗进展有重要意义。本研究利用蛋白芯片结合生物信息学分析筛选结直肠癌患者血清中差异表达蛋白,将筛选出的差异蛋白作为候选,构建支持向量机(Support Vector Machine,SVM)模型预测其对CRC的诊断效能,评估候选蛋白能否作为CRC潜在的诊断标志物或药物靶点。方法1.采集12例临床确诊的CRC患者和同期12例健康对照者的血清标本,用蛋白芯片筛选CRC患者血清差异表达蛋白。2.对筛选出的差异蛋白做层次聚类、功能富集、PPI网络构建、药物-靶基因相互作用网络构建等生物信息学分析;利用TCGA结直肠癌临床数据,将差异蛋白作为候选因子,分析候选因子与患者预后的关系。3.用蛋白检测芯片检测34例CRC患者和34例健康对照者血清中的差异蛋白表达情况,筛选显著差异蛋白;将提取的显著差异蛋白在两组样本中的表达值作为特征值建立SVM诊断模型,通过ROC曲线评价模型对CRC的分类预测效能。结果1.累加强度指标下筛选出6个差异蛋白,酪氨酸蛋白激酶受体(Tyrosine receptor kinase 3,TYRO3)和趋化因子26(C-C motif ligand 26,CCL26)表达上调,肿瘤坏死因子受体超家族成员10C(Tumor Necrosis Factor Receptor Superfamily Member 10C,TNFRSF10C)、巨噬细胞移动抑制因子(Macrophage migration inhibitory factor,MIF)、巨噬细胞刺激蛋白-1(Macrophage stimulating protein,MSP-α)和白介素-16(Interleukin-16,IL-16)表达下调。2.平均累加强度指标下筛选出6个差异蛋白,其中血管生成素-2(Angiopoietin-2,ANG-2),刺豚鼠相关蛋白(Agouti-related protein,Ag RP)、成纤维细胞生长因子-4(Fibroblast growth factor 4,FGF-4)、成纤维细胞生长因子-9(Fibroblast growth factor 9,FGF-9)表达上调,白介素-8(Interleukin-8,IL-8)和血小板生成素(Thrombopoietin,TPO)表达下调。3.平均净累加强度指标下筛选到4个下调的差异蛋白,分别为血管内皮细胞生长因子-D(Vascular Endothelial cell Growth Factor D,VEGF-D)、趋化因子25(C-C motif ligand 25,CCL25)、趋化因子-16(C-C motif ligand 16,CCL16)和白介素-8(Interleukin-8,IL-8)。4.基因本体(Gene Ontology,GO)富集分析显示,差异蛋白主要显著富集在ERK1和ERK2级联的正向调节过程、细胞趋化性过程以及白细胞迁移等过程。京都基因和基因组百科(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析显示,差异蛋白主要富集在细胞因子与细胞因子受体的互作通路、趋化因子信号通路、Rap1、Ras、MAPK等信号通路。5.蛋白质-蛋白质相互作用网络(Protein-Protein Interaction,PPI)中共有12个节点,其中表达下调的有CCL25、CCL16、IL-16、IL-8、VEGF-D、MIF、TNFRSF10C,表达上调的有TYRO3、CCL26、ANGPT2、FGF-4和FGF-9。12个节点之间组成12个PPI关系对。6.药物-基因相互作用(Drug-gene interaction,DGI)分析共得到了5个基因、10种药物和10个药物-基因互作关系对。5种基因分别为TYRO3、MIF、ANGPT2、FGF-4和TPO,10种药物分别为盐酸丙美卡因(Proparacaine)、柠檬酸(Citric acid)、贝伐珠单抗(Bevacizumab)、利巴韦林(Ribavirin)、木聚硫钠(Pentosan polysulfate sodium)、卡比马唑(Carbimazole)、甲巯基咪唑(Methimazole)、丙硫氧嘧啶(Propylthiouracil)、维甲酸(Tretinoin)和右旋甲状腺素(Dextrothyroxine)(表8)。FGF-4-木聚硫钠、TPO-卡比马唑、TPO-甲巯基咪唑和TPO-丙硫氧嘧啶之间为抑制性作用。5.生存分析显示FGF-4与CRC预后相关(p0.1)。6.15个差异表达蛋白中,5个蛋白在疾病组表达上调,分别为IL-8、MSP-a、MIF、TNFRSF10C和TYRO3;10个蛋白在疾病组表达下调,分别为IL-16、CCL-26、TPO、VEGF-D、CCL25、CCL16、ANG-2、FGF-4、Ag RP和FGF-9。生信分析得到6个显著差异蛋白,分别为IL-8、MSP-a、MIF、FGF-9、ANG-2和Ag RP。7.利用6个显著差异蛋白建立SVM模型,其诊断CRC的AUC面积为0.985,除CRC组的10号、11号和20号样本,其余样本都能根据该模型被正确地分组。结论本研究利用蛋白芯片结合生信分析在CRC患者血清中筛选到15个差异蛋白,其中IL-8、MSP-a、MIF、FGF-9、ANG-2和Ag RP为显著差异蛋白。利用6个显著差异蛋白建立的SVM模型对CRC有较好的诊断效能。
【学位单位】:吉林大学
【学位级别】:博士
【学位年份】:2020
【中图分类】:R735.34
【部分图文】: 用R语言对原始数据做归一化处理,以消除蛋白芯片实验过程中由于系统变异对检测的蛋白表达水平的影响,这是保证蛋白芯片数据后续分析真实可信的保证。用R语言查看各样本内部蛋白表达数据在归一化前后的情况(详见附录-表1-1、附录-表1-2、附录-表2-1、附录-表2-2、附录-表3-1、附录-表3-2)。累加强度、平均累加强度、平均净累加强度三项指标在预处理前后结果如图1、图2和图3所示。数据密度分布曲线可以看出,各样本数据内部结构发生显著变化。图2 各样本归一化前后的平均累加强度变化
各样本归一化前后的平均累加强度变化
各样本归一化前后的平均净累加强度变化
【相似文献】
相关期刊论文 前10条
1 孙希凤;秦斌;王欣;;基于SVM的永磁无刷直流电机无位置传感器控制[J];电子产品世界;2020年01期
2 韩旭;杨珊;王喜梅;;基于商空间的黄金价格SVM模型预测[J];黄金科学技术;2020年01期
3 苏筱丽;;基于主成分降维的SVM回归模型在煤与瓦斯突出预测中的应用[J];工业计量;2020年01期
4 朱亚飞;付舒悦;杨仕虎;姚佩玲;谭颖;;基于SVM与fMRI技术对精神分裂症的分类研究[J];现代计算机;2020年01期
5 申莹;刘春阳;赵永翼;;基于SVM算法的微博评论数据情感分析[J];数字通信世界;2020年01期
6 王建;;基于SVM的煤与瓦斯突出预测模型及应用[J];陕西煤炭;2020年02期
7 杨萌宇;张雷;;基于超声波扫描和SVM的综合管廊故障诊断模型[J];科技与创新;2020年07期
8 闫锋;吕双祺;;基于SVM理论的航空发动机飞行数据可视化建模[J];科技创新与应用;2020年12期
9 叶志雄;王丹弘;;基于海量数据的不平衡SVM增量学习的钓鱼网站检测方法[J];电信工程技术与标准化;2016年12期
10 齐兴;;结合主方向和SVM的人脸表情识别[J];廊坊师范学院学报(自然科学版);2016年04期
相关博士学位论文 前10条
1 崔明福;基于蛋白芯片联合生物信息学分析技术筛选结直肠癌血清标志物及SVM诊断模型构建[D];吉林大学;2020年
2 张元侠;基于SVM学习模型的换挡决策研究[D];吉林大学;2019年
3 张婧;基于SVM的肺结节自动识别方法研究[D];华南理工大学;2011年
4 欧阳玲;基于遥感和SVM模型的松嫩平原南部耕地质量评价[D];中国科学院大学(中国科学院东北地理与农业生态研究所);2017年
5 孙钢;基于SVM的入侵检测系统研究[D];北京邮电大学;2007年
6 陈沅涛;图像视觉显著性和改进型SVM在图像分割中的研究[D];南京理工大学;2014年
7 张克;基于地震正演模拟和SVM的煤与瓦斯突出危险区预测研究[D];中国矿业大学;2011年
8 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
9 陈志茹;基于SVM集成学习的miRNA靶基因预测研究[D];燕山大学;2015年
10 陈梅香;基于SVM和GIS的梨小食心虫预测系统的研究[D];北京林业大学;2010年
相关硕士学位论文 前10条
1 郑留洋;基于车联网数据的货车出行风险画像与影响因素分析[D];北京交通大学;2019年
2 赵云飞;基于SVM的风电工程项目风险评价及防控措施研究[D];华北电力大学(北京);2019年
3 朱旭昇;基于多传感器特征融合和SVM的跌倒检测系统设计[D];广东工业大学;2019年
4 马园园;基于SVM的密封电子元器件组件信号识别技术开发[D];黑龙江大学;2019年
5 王霄;基于SVM的沪深300指数量化择时策略实证研究[D];兰州大学;2019年
6 孙晨光;基于PSO优化SVM的滚动轴承剩余使用寿命预测研究[D];石家庄铁道大学;2019年
7 陈俊哲;120°坐标系三电平SVM无速度传感器控制系统的研究[D];上海交通大学;2016年
8 宿绍勋;基于SVM文本分类的传销识别研究[D];北京工业大学;2019年
9 靳浩杨;基于SVM技术的音频分类事件识别[D];内蒙古科技大学;2019年
10 沈芬;基于SVM的电商评论文本情感倾向性分析[D];燕山大学;2019年
本文编号:
2880178
本文链接:https://www.wllwen.com/shoufeilunwen/yxlbs/2880178.html