基于深度协同过滤模型的致病基因预测方法研究
发布时间:2021-02-10 15:17
发掘控制疾病发生的新基因具有重要的医学意义。致病基因为阐明疾病机理和预测疾病潜在风险提供了有效线索。近年来,伴随着生物信息学相关技术的发展,各种基因组、基因型和表型等生物数据出现爆发式增长,基于多重生物网络的计算方法为基因疾病关系预测发挥了重要作用。然而,这些生物网络通常伴随着高噪声高维度等特点,这大大影响了网络的可靠性。本文主要研究基因与疾病关联关系的预测方法,主要包括了基因和疾病的特提取及矩阵填充两个重要部分。本文围绕这两个环节进行优化和改进。具体的研究内容如下:1)为了获取更深层的生物特征,引入了深度学习模型——多层降噪自编码器(SDAE)来处理基因相关数据集,并与传统协同过滤方法相结合,构建一个深度协同过滤(DCF)模型。将这个模型作为本文研究工作的基准模型。2)由于基因-疾病关联关系数据存在不确定反馈的特性,采用基于正类和无标签样本的学习方法(PU learning),有差别地惩罚对正类样本和无标签样本误分类的情况。实验结果表明,PU模型性能略高于基准模型,验证了有偏学习方法的在这一特定场景下的作用。3)为了进一步挖掘基因相关数据集的可利用信息,借鉴网络表示学习中节点嵌入(n...
【文章来源】:厦门大学福建省 211工程院校 985工程院校 教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图1-i致病基因预测方法一般步骤??
Years??图1-2?PubMed数据库中生物信息学相关著作过去三十年的数量变化情况[14]??如图1-2所示,自1970年作为一个学科领域被提出以来,生物信息学己经经??过了四十多年的持续发展。在PubMed数据库丨13]中检索生物信息学关键字,可以??
取得重大进步,生物信息学领域也不例外。深度学习可以帮助从DNA序列中发??现连接点,从X射线图像中识别手指关节,从脑电图(EEG)信号中检测到失误??等,上述过程如图3-1所示:??17??
【参考文献】:
期刊论文
[1]PTEN in liver diseases and cancer[J]. Marion Peyrou,Lucie Bourgoin,Michelangelo Foti. World Journal of Gastroenterology. 2010(37)
[2]全基因组关联分析的进展与反思[J]. 凃欣,石立松,汪樊,王擎. 生理科学进展. 2010(02)
本文编号:3027568
【文章来源】:厦门大学福建省 211工程院校 985工程院校 教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图1-i致病基因预测方法一般步骤??
Years??图1-2?PubMed数据库中生物信息学相关著作过去三十年的数量变化情况[14]??如图1-2所示,自1970年作为一个学科领域被提出以来,生物信息学己经经??过了四十多年的持续发展。在PubMed数据库丨13]中检索生物信息学关键字,可以??
取得重大进步,生物信息学领域也不例外。深度学习可以帮助从DNA序列中发??现连接点,从X射线图像中识别手指关节,从脑电图(EEG)信号中检测到失误??等,上述过程如图3-1所示:??17??
【参考文献】:
期刊论文
[1]PTEN in liver diseases and cancer[J]. Marion Peyrou,Lucie Bourgoin,Michelangelo Foti. World Journal of Gastroenterology. 2010(37)
[2]全基因组关联分析的进展与反思[J]. 凃欣,石立松,汪樊,王擎. 生理科学进展. 2010(02)
本文编号:3027568
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3027568.html