当前位置:主页 > 科技论文 > 自动化论文 >

对异质性肿瘤样本的基因表达数据反卷积计算方法的综合评价

发布时间:2021-12-02 11:34
  根据世界卫生组织(WHO)2018年的报告,癌症是全球第二大死亡原因,在世界范围内至少导致960万人的死亡。近年来,癌症的发病率和死亡人数都在不断增加。与此同时,在机器学习和人工智能领域,随着深度学习等新技术的不断发展,人工智能算法已逐渐在生物信息学领域崭露头角。人们已经迫不及待利用计算机技术来研究生命的现象和规律。癌症是由一系列复杂的基因突变所引发的疾病,因而在基因层面研究癌症对我们了解肿瘤的发生和发展机制,以及对癌症进行早期筛查、诊断和治疗都具有重大的意义。本课题利用三种反卷积计算方法:NNLS、CIBERSORT和XGBoost,对Dream Challenges社区放出的最新RNA-seq人类基因表达数据集DS389、DS488进行反卷积计算,得到不同细胞类型的构成比例。通过对比计算结果和真实数据的相关性发现,CIBERSORT方法的计算结果准确度最高、XGBoost方法次之、NNLS方法最低。值得一提的是,这是XGBoost方法第一次用于基因表达数据的反卷积计算。基于深度学习技术,我们开发了一款神经网络评价模型,可以为数据推荐反卷积计算方法。实验结果表明,这款基于深度学习的评... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:61 页

【学位级别】:硕士

【部分图文】:

对异质性肿瘤样本的基因表达数据反卷积计算方法的综合评价


肿瘤反卷积方法论文的增长进行反卷积的R包

交叉验证,训练集


数。测试集只用来评价模型,不用于学习模型参数和选择参数,整个过程只使用一次。但是如果数据量太小的话,那么分出的训练集太小,导致模型对数据集的学习不够,出现欠拟合(Underfitting)问题。为了解决数据量太小的问题,就出现了交叉验证技术。交叉验证只将数据集分为训练集和测试集。然后再将训练集分为K份子集,每次将1份作为验证集,剩下的K-1份作为训练集,这样循环K次,保证每一份都做过训练集,最后将平均每次的误差和作为最后的误差。这就是我们常用的K折交叉验证(K-foldCross-validation),如图2-1所示。图2-1K折交叉验证

过程图,反卷积,过程


哈尔滨工业大学工程硕士学位论文-16-第3章反卷积计算方法3.1反卷积计算过程反卷积计算过程是卷积的逆问题。反卷积则是广泛用于信号和图像处理的卷积的逆过程。如今,在这机器学习和深度学习蓬勃发展的时代,卷积和反卷积也在其中扮演着重要角色。比如,卷积(Convolution)操作是深度学习最核心的技术,起到一个提取特征的作用。在生物学中,反卷积计算方法也应用在基因表达数据上。组织中的基因表达谱是细胞类型特异性基因表达特征与不同细胞类型的比例卷积的结果。反卷积计算方法则是通过利用基因表达特征矩阵来计算组织中未知的细胞比例。具体而言,反卷积方法将分离的细胞类型的表达谱和复杂组织的表达谱作为输入,组织中每个基因的表达被建模为其在每种细胞类型中表达的线性组合,其中权重代表每种细胞类型的未知含量。在数学上,对基因数据反卷积表达计算是一个超定方程组(Over-determinedSystem)问题,其表达形式如公式(3-1)所示:=×(3-1)式中:m——组织中的基因表达数据;S——基因表达特征矩阵;f——不同细胞类型比例。因为方程数(基因的数量)远远超过未知数个数(组织中的细胞类型总数),并且矩阵S是列满秩的,这个方程组并没有精确解,我们只能通过一些优化算法来求出它的近似解。反卷积计算过程如图3-1所示。图3-1反卷积计算过程[8]

【参考文献】:
期刊论文
[1]基于基因表达谱预测肿瘤浸润免疫细胞类型及比例的解卷积算法[J]. 裴晶晶,余彩裙,佘玉梅.  云南民族大学学报(自然科学版). 2019(04)
[2]2015年中国恶性肿瘤流行情况分析[J]. 郑荣寿,孙可欣,张思维,曾红梅,邹小农,陈茹,顾秀瑛,魏文强,赫捷.  中华肿瘤杂志. 2019 (01)
[3]肝癌小鼠脾脏免疫细胞的变化及其意义[J]. 李宝华,黄娜,陈海燕,张澍,王佩俊,杨军,李宗芳.  现代肿瘤医学. 2018(13)
[4]基于深度学习的八类蛋白质二级结构预测算法[J]. 张蕾,李征,郑逢斌,杨伟.  计算机应用. 2017(05)
[5]基于深度学习和医学图像的癌症计算机辅助诊断研究进展[J]. 陈诗慧,刘维湘,秦璟,陈亮亮,宾果,周煜翔,汪天富,黄炳升.  生物医学工程学杂志. 2017(02)



本文编号:3528351

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3528351.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6a276***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com