当前位置:主页 > 理工论文 > 生物学论文 >

基于Hi-C数据的染色质三维结构重构算法和网络服务

发布时间:2020-12-10 20:22
  染色质的三维结构在基因表达调控、细胞发育以及遗传疾病发生等过程中发挥着重要的作用。随着染色质构象捕获技术及其衍生技术的发展,尤其是全基因组范围内捕获染色质交互的Hi-C技术的出现,现已获得大量的染色质交互频率数据。如何利用这些数据重构出染色质的三维构象,已经成为三维基因组学领域的一个重要研究方向。目前已有的重构算法主要分为两类:基于热力学的方法和基于距离约束的方法。这些重构方法的应用有助于揭示染色质结构的形成机制及其生物学功能。本文提出了一种基于共聚集系数和误差矢量合成的三维结构重构算法——EVRC算法。该算法首先计算染色质片段间的共聚集系数,然后将一个片段的所有误差矢量加和,通过不断迭代优化,重构出染色质的三维结构。为了评价算法的有效性和准确性,我们将其应用于六种典型结构的模拟数据集和真实的Hi-C数据集。在不同转换参数与随机噪声下,重构从简单到复杂的六种模拟结构时,结果显示,重构结构与真实结构之间均具有很高的相似性,表明了EVRC算法的有效性和鲁棒性。应用于真实的Hi-C数据时,我们首先对野生型拟南芥的5条染色体在不同分辨率下进行三维重构,显示了染色体间的结构特征差异。在重构野生型... 

【文章来源】:华中农业大学湖北省 211工程院校 教育部直属院校

【文章页数】:58 页

【学位级别】:硕士

【部分图文】:

基于Hi-C数据的染色质三维结构重构算法和网络服务


及其衍生技术(BonevandCav.lli2016)

示意图,系数,示意图,三维结构


基于 Hi-C 数据的染色质三维结构重构算法和网络服务 。式中, 表示 中节点两两连接的边数目。在实际交互网络中, 之间存在连接的边数目为 ,那么节点 和 的共聚集系数为: 。式中, 表示节点 和 的共聚集系数(图 2)。 越接近 1,表明 和 在染色质三维结构中聚集倾向越大,比如位于 TAD 区域中的 。我们把共聚集系数作为三维结构重构的重要参数。

示意图,示意图,空间距离,空间结构


个时刻 和 的位置关系如图 3(A)所示, 和 表示对应的位置矢量, 表示 的单位矢量, 表示 和 之间的空间距离, 和 之间的误差矢量为 ,其表达式如下: | | | | 。根据 Hi-C 分辨率的不同, 自身具有一定的线性长度(即核苷酸数目),折叠后形成空间结构。而染色质折叠状态不同,空间结构的直径也不同。我们假定单个 的最大直径为 ,最小直径为 。虽然 Hi-C 数据处理后的交互矩阵通过负指数关系转换为了空间距离矩阵,但由于实验误差等原因,某些空间距离信息并不准确。因此,我们可以根据距离阈值条件来矫正误差矢量计算。根据 和 在基因组上的线性关系,该算法又可分为两个部分:1. 计算线性不相邻的 之间的误差矢量。不相邻的 和 之间的最小距离


本文编号:2909314

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2909314.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户89857***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com