DNA甲基化转移酶结合位点预测的网络正则最优化建模

发布时间:2022-11-04 23:44
  大数据建模中的高维优化问题通常通过引入正则化(Regularization)来约束模型的复杂度,提升模型的解释性,改善或者减少过拟合来提高预测精度。例如稀疏性正则化产生于信号处理领域,发展出了lasso以及压缩感知等经典模型。本论文将探讨将刻画变量之间相互关系的网络结构引入正则化,构建最优化模型,建模生物医学数据。具体而言,集成转录组,表观组、蛋白质相互作用等多组学数据,重建调控网络,构建网络正则最优化模型,预测DNA甲基化转移酶(DNA methlytransferase,DNMT)结合位点。DNMT介导的DNA甲基化在在胚胎发育和肿瘤发生等重要的生物过程中具有十分重要的作用。然而DNMT在许多组织和细胞系中的结合位点实验上难以观测,数据是缺失的,极大的阻碍了对这一重要蛋白质家族的功能和机理研究。有必要发展计算生物学方法,集成大量高通量测序技术产生的多组学数据,来预测DNMT结合位点信息。本文构建数学最优化模型,集成多组学数据,预测DNMT在基因组上的结合位点,主要的工作包括以下几个方面:(1)基于adaptive lasso正则化的逻辑回归(logistic regression,... 

【文章页数】:72 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
缩略语表
第一章 引言
    1.1 DNA甲基化
    1.2 DNA甲基化转移酶
    1.3 染色质状态
    1.4 高通量实验技术与多组学数据
        1.4.1 染色质免疫共沉淀测序技术
        1.4.2 DNase I超敏位点测序技术
        1.4.3 转座酶测定染色质可及性测序技术
        1.4.4 转录组测序技术
        1.4.5 全基因组重亚硫酸盐测序
    1.5 DNMT结合位点与机制研究背景
    1.6 基于逻辑回归的最大似然优化模型
    1.7 正则化方法的研究现状
    1.8 本论文内容安排
第二章 预测DNMT结合位点的最优化模型(GuidingNet)
    2.1 GuidingNet建模的框架
    2.2 GuidingNet模型
        2.2.1 特征选择
        2.2.2 特征组合
        2.2.3 基于逻辑回归的网络正则最优化模型
        2.2.4 黄金标准数据的构造
    2.3 GuidingNet模型的训练与输出
    2.4 小结
第三章 GuidingNet的预测精度及特征选择性能
    3.1 数据收集
    3.2 GuidingNet能准确预测DNMT结合位点
    3.3 GuidingNet优于基于单个特征预测
    3.4 GuidingNet的网络正则化性能
    3.5 网络正则化与其他正则化方法的比较
    3.6 GuidingNet与随机选择TF进行预测的比较
    3.7 小结
第四章 GuidingNet增强DNMT结合位点预测的生物学解释
    4.1 GuidingNet揭示出DNMT结合机制中关键的转录因子
    4.2 不同DNMT在不同细胞环境中的结合模式的差异
    4.3 DNA甲基化数据对GuidingNet预测结果的验证
    4.4 GuidingNet可应用于Dnmt3b跨组织预测
    4.5 小结
第五章 GuidingNet应用于其他染色质重塑因子的结合位点预测
    5.1 单个特征对其他染色质重塑因子结合位点的预测能力
    5.2 GuidingNet对其他染色质重塑因子结合位点的预测精度
    5.3 GuidingNet在其他染色质重塑因子预测中特征选择方面的表现
    5.4 本章小结与讨论
第六章 结论与展望
    6.1 本文的主要贡献
    6.2 工作展望
参考文献
发表文章目录
致谢



本文编号:3701552

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3701552.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户99dd4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com