基于深度学习的复杂疾病致病基因识别算法研究
发布时间:2021-05-05 22:12
复杂疾病是一类遗传机制复杂,由多基因共同影响导致的疾病,同时与外部环境因素也有一定的关系,是基因与环境共同作用的结果。鉴定复杂疾病的生物标志物是研究其发病机制、诊断与治疗的关键。近年来,深度学习得到快速地发展,在复杂数据集上表现出优异的性能,为在生物医学领域寻找复杂疾病生物标志物的方法研究提供了可能。本文尝试探索一种基于深度学习的针对复杂疾病致病基因的筛选方法,以双相情感障碍和Ⅱ型糖尿病这两种复杂疾病为例开展研究工作。1.基于卷积神经网络的复杂疾病的疾病分类研究。针对卷积神经网络对于输入训练数据的要求,将下载获取的样本SNP位点数据经过GWAS筛选和编码转换处理为BMP图像数据,以样本为单位组织为Case-Control数据集。针对两种疾病搭建各自的卷积神经网络,分别进行多次训练,不断调整超参数直到获得较优的模型。最终训练得到的双相情感障碍疾病分类模型的精度是94.5%,Ⅱ型糖尿病疾病分类模型的精度是97.81%。2.使用Grad-CAM(Gradient-weighted Class Activation Mapping)对训练得到的模型进行解释性研究。分别针对两种疾病的分类模型进行...
【文章来源】:重庆邮电大学重庆市
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
注释表
第1章 绪论
1.1 复杂疾病概述
1.1.1 复杂疾病与人类健康
1.1.2 双相情感障碍
1.1.3 Ⅱ型糖尿病
1.2 深度学习概述
1.2.1 卷积神经网络
1.2.2 卷积神经网络的可视化方法Grad-CAM
1.3 深度学习与疾病研究
1.3.1 深度学习在疾病研究领域的应用与发展
1.3.2 存在的挑战
1.4 本文的主要研究内容
1.5 论文结构安排
第2章 构建深度学习训练数据集
2.1 数据来源
2.2 数据处理的主要流程
2.3 通过GWAS进行SNP位点筛选
2.3.1 双相情感障碍SNP位点筛选
2.3.2 Ⅱ型糖尿病SNP位点筛选
2.4 数据转换
2.4.1 双相情感障碍数据转换结果
2.4.2 Ⅱ型糖尿病数据转换结果
2.5 划分数据集
2.5.1 双相情感障碍Case-Control数据集的划分
2.5.2 Ⅱ型糖尿病Case-Control数据集的划分
2.6 本章小结
第3章 基于卷积神经网络的复杂疾病分类研究
3.1 卷积神经网络参数简介
3.1.1 激活函数
3.1.2 抑制过拟合的Dropout方法
3.1.3 Alex Net的网络结构
3.2 基于卷积神经网络的疾病分类模型研究的主要流程
3.2.1 主要流程及方法
3.2.2 软件环境及硬件配置
3.3 双相情感障碍疾病分类模型的训练
3.4 Ⅱ型糖尿病疾病分类模型的训练
3.5 本章小结
第4章 基于Grad-CAM的风险基因筛选研究
4.1 基因富集分析工具Metascape
4.2 风险基因的筛选流程
4.3 双相情感障碍的风险基因筛选研究
4.3.1 计算双相情感障碍疾病分类模型的Grad-CAM
4.3.2 统计筛选风险基因
4.3.3 使用Metascape进行分析
4.4 Ⅱ型糖尿病的风险基因筛选研究
4.4.1 计算Ⅱ型糖尿病疾病分类模型的Grad-CAM
4.4.2 统计筛选风险基因
4.4.3 使用Metascape进行分析
4.4.4 使用OMIM数据库进行检索对比
4.5 本章小结
第5章 总结与展望
5.1 主要成果与创新点
5.1.1 主要成果
5.1.2 创新点
5.2 课题展望
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果
【参考文献】:
期刊论文
[1]双相抑郁的特点、危害及药物治疗研究进展[J]. 袁铭,李素敏,王雪芹,李素霞,陆林. 中国全科医学. 2016(10)
[2]双相情感障碍:综述[J]. 周淑新,李雯. 中国全科医学. 2013(06)
博士论文
[1]双相情感障碍与重性抑郁障碍在抑郁发作阶段脑白质网络的比较研究[D]. 殷志洋.中国医科大学 2019
本文编号:3170674
【文章来源】:重庆邮电大学重庆市
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
注释表
第1章 绪论
1.1 复杂疾病概述
1.1.1 复杂疾病与人类健康
1.1.2 双相情感障碍
1.1.3 Ⅱ型糖尿病
1.2 深度学习概述
1.2.1 卷积神经网络
1.2.2 卷积神经网络的可视化方法Grad-CAM
1.3 深度学习与疾病研究
1.3.1 深度学习在疾病研究领域的应用与发展
1.3.2 存在的挑战
1.4 本文的主要研究内容
1.5 论文结构安排
第2章 构建深度学习训练数据集
2.1 数据来源
2.2 数据处理的主要流程
2.3 通过GWAS进行SNP位点筛选
2.3.1 双相情感障碍SNP位点筛选
2.3.2 Ⅱ型糖尿病SNP位点筛选
2.4 数据转换
2.4.1 双相情感障碍数据转换结果
2.4.2 Ⅱ型糖尿病数据转换结果
2.5 划分数据集
2.5.1 双相情感障碍Case-Control数据集的划分
2.5.2 Ⅱ型糖尿病Case-Control数据集的划分
2.6 本章小结
第3章 基于卷积神经网络的复杂疾病分类研究
3.1 卷积神经网络参数简介
3.1.1 激活函数
3.1.2 抑制过拟合的Dropout方法
3.1.3 Alex Net的网络结构
3.2 基于卷积神经网络的疾病分类模型研究的主要流程
3.2.1 主要流程及方法
3.2.2 软件环境及硬件配置
3.3 双相情感障碍疾病分类模型的训练
3.4 Ⅱ型糖尿病疾病分类模型的训练
3.5 本章小结
第4章 基于Grad-CAM的风险基因筛选研究
4.1 基因富集分析工具Metascape
4.2 风险基因的筛选流程
4.3 双相情感障碍的风险基因筛选研究
4.3.1 计算双相情感障碍疾病分类模型的Grad-CAM
4.3.2 统计筛选风险基因
4.3.3 使用Metascape进行分析
4.4 Ⅱ型糖尿病的风险基因筛选研究
4.4.1 计算Ⅱ型糖尿病疾病分类模型的Grad-CAM
4.4.2 统计筛选风险基因
4.4.3 使用Metascape进行分析
4.4.4 使用OMIM数据库进行检索对比
4.5 本章小结
第5章 总结与展望
5.1 主要成果与创新点
5.1.1 主要成果
5.1.2 创新点
5.2 课题展望
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果
【参考文献】:
期刊论文
[1]双相抑郁的特点、危害及药物治疗研究进展[J]. 袁铭,李素敏,王雪芹,李素霞,陆林. 中国全科医学. 2016(10)
[2]双相情感障碍:综述[J]. 周淑新,李雯. 中国全科医学. 2013(06)
博士论文
[1]双相情感障碍与重性抑郁障碍在抑郁发作阶段脑白质网络的比较研究[D]. 殷志洋.中国医科大学 2019
本文编号:3170674
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3170674.html
最近更新
教材专著