DNA序列分析和抗癌药物敏感性预测的计算模型
发布时间:2023-04-19 00:35
高通量测序技术产生了海量的基因组学数据和抗癌药物组学数据。建立有效的计算模型是快速挖掘这些大数据蕴含的信息的重要手段。本文首先基于DNA序列的碱基转移概率、碱基含量和碱基位置比三类特征构造了 24维特征向量,成功应用于11物种β-珠蛋白基因完整编码序列和18物种哺乳动物线粒体基因组序列的相似性比较,构建的系统发生树与进化事实相符。然后基于该特征向量,结合支持向量机分类识别了 28株细菌中的必需基因,平均AUC值高达0.808,高于部分识别方法。最后的实验结果表明:生物序列基本构成元素的转移概率、含量和位置比可作为研究生物信息学中相关分类问题的选择性工具。准确预测细胞内抗癌药物的反应,有助于实现肿瘤的精确医疗。目前流行的计算模型无法解决新(未经检验的)药物与新(未经检验的)细胞系间的敏感性预测问题。基于癌细胞系百科全书(CCLE)和癌症药物敏感性基因组学数据库(GDSC)两个基准数据集,论文首先利用分类方法验证了一个一般性假设,即“基因相似的细胞系与结构相似的药物之间其反应也相似”。接下来借助细胞系基因表达谱的相似性和药物化学结构的相似性构建了“细胞系-药物复杂网络”。这两项工作告诉我们...
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题背景及研究目的和意义
1.2 国内外研究现状
1.2.1 生物序列分析计算模型
1.2.2 抗癌药物敏感性预测计算模型
1.3 论文的主要工作
1.4 论文结构
第2章 基于碱基组成和分布的DNA序列分析计算模型
2.1 构造24维DNA序列特征向量
2.2 基于24维特征向量的序列分析与比较
2.2.1 实验数据集
2.2.2 序列分析与比较结果
2.3 基于24维特征向量的必需基因识别
2.3.1 实验数据集
2.3.2 必需基因识别算法与结果
2.3.3 必需基因识别算法分析
2.4 本章小结
第3章 抗癌药物敏感性预测的复杂网络计算模型
3.1 实验数据集与数据预处理
3.2 细胞系相似性和药物相似性度量方法
3.3 细胞系-药物复杂网络计算模型框架
3.3.1 计算模型假设
3.3.2 细胞系-药物复杂网络计算模型
3.4 抗癌药物敏感性预测结果
3.4.1 无类型限制的“细胞系-药物”敏感性预测
3.4.2 “新细胞系-新药物”的敏感性预测
3.4.3 GDSC数据集中缺失值的预测
3.5 本章小结
结论
参考文献
攻读硕士学位期间承担的科研任务与主要成果
致谢
本文编号:3793356
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题背景及研究目的和意义
1.2 国内外研究现状
1.2.1 生物序列分析计算模型
1.2.2 抗癌药物敏感性预测计算模型
1.3 论文的主要工作
1.4 论文结构
第2章 基于碱基组成和分布的DNA序列分析计算模型
2.1 构造24维DNA序列特征向量
2.2 基于24维特征向量的序列分析与比较
2.2.1 实验数据集
2.2.2 序列分析与比较结果
2.3 基于24维特征向量的必需基因识别
2.3.1 实验数据集
2.3.2 必需基因识别算法与结果
2.3.3 必需基因识别算法分析
2.4 本章小结
第3章 抗癌药物敏感性预测的复杂网络计算模型
3.1 实验数据集与数据预处理
3.2 细胞系相似性和药物相似性度量方法
3.3 细胞系-药物复杂网络计算模型框架
3.3.1 计算模型假设
3.3.2 细胞系-药物复杂网络计算模型
3.4 抗癌药物敏感性预测结果
3.4.1 无类型限制的“细胞系-药物”敏感性预测
3.4.2 “新细胞系-新药物”的敏感性预测
3.4.3 GDSC数据集中缺失值的预测
3.5 本章小结
结论
参考文献
攻读硕士学位期间承担的科研任务与主要成果
致谢
本文编号:3793356
本文链接:https://www.wllwen.com/yixuelunwen/yiyaoxuelunwen/3793356.html
最近更新
教材专著