基于Hi-C数据的染色质接触域边界检测与应用研究
发布时间:2020-12-21 13:49
作为染色质的基本结构和功能单元,染色质接触域由不同大小的共调控基因簇构成,其与基因调控和细胞的定向分化密切相关,在不同物种中具有一定的保守性。随着染色体构象捕获及其衍生技术的迅速发展,尤其是高通量Hi-C技术的出现,染色质三维交互作用数据日渐丰富,为染色质接触域及其边界的定位与检测提供了物质条件,使得相关领域的研究成为了表观遗传学研究的重要课题。但目前的染色质接触域及其边界检测工具及算法还非常有限,普遍存在可重复性差、运行时间成本高和检测准确率低等一系列问题,因此在已有算法基础上提出新的检测方法是弥补上述技术缺陷的关键。本文通过对现有两类代表性的染色质相互作用域检测方法进行系统比较与分析,选取了目前应用最为广泛的基于一维统计量方法,并在现有HiCDB和TopDom算法基础上提出了基于绝缘密度统计量来表征接触域边界强度变化的Hi-C绝缘密度检测算法(Hi-C Insulation Density,HiCID)。此外,为了提高原始Hi-C数据信噪比,本文将网络增强技术嵌入到数据预处理过程,并根据绝缘子结合蛋白(CTCF)与组蛋白修饰的富集丰度确定域边界的筛选阈值,同时为不同分辨率的Hi-C...
【文章来源】:云南民族大学云南省
【文章页数】:91 页
【学位级别】:硕士
【部分图文】:
Hi-C技术发展动态
第1章绪论5图1.2染色质作用域及域边界检测算法尽管目前的染色质相互作用域检测工具为确定染色质作用域及其边界提供了诸多选择。然而,大多数算法在算法结构或性能上都存在着不同程度的缺陷:例如在识别TAD时要设置很多参数,运算过程较复杂;计算上鲁棒性低导致检测结果差异大,可重复性低;对不同物种或不同分辨率的Hi-C数据不具备普遍适用性等等。从染色质相互作用域及其边界检测的总体发展趋势来看,基于一维统计量的检测模型作为当前领域内出现的最早和最基础的一类算法,仍然极具一定的潜力和研究价值。现有算法模型为染色质作用域及其边界的检测研究提供了更多的分析角度和参考信息,为新算法的提出或迭代改进提供了广阔空间。1.3主要研究工作本文的主要工作是对染色质结构域及其域边界进行有效定位与检测。在深入分析当前染色质结构域边界检测的主要方法基础上,以提高接触域边界的检测定位精度为目标,对基于一维统计量的HiCDB算法和TopDom进行了推陈出新,提出了以绝缘密度为核心的染色质结构域边界检测算法——HiCID。该算法能够在只提供滑动窗口大小的前提下检测出染色质结构域边界所在的位置,并能进一步对结构域、域边界和无相互作用的染色体间隙进行划分。此外,本文最后介绍了应用HiCID算法对染色体结构域和边界位点的基因功能进行研究的结果。
第2章Hi-C数据预处理与染色质作用域检测方法分析9第2章Hi-C数据预处理与染色质作用域检测方法分析2.1引言染色质相互作用域作为染色质的基本结构和功能单元,对基因的调控表达以及基因功能的发挥有着直接的影响。为了对染色质相互作用域的检测识别进行更加深入的研究,本章将从染色质结构及其层次划分、Hi-C数据生成以及常见的几类Hi-C数据预处理算法展开详细介绍,重点介绍了目前在染色质相互作用域检测方法中普遍使用的两类算法:基于一维统计量的检测模型和基于二维接触矩阵的检测模型。2.2染色质结构2.2.1染色质分层结构的划分图2.1染色质间交互热图和细胞核内染色质疆域染色质之间的各基因位点相较于染色质内部有较少的相互作用,因此不同染色质在细胞核中占据不同的疆域,这与在显微镜下观测的结果相一致。2009年首次出现了Hi-C技术,研究者们试图从染色质相互作用矩阵来了解染色质三维构象。Hi-C相互作用矩阵在热图中呈现格子形状。研究发现,细胞核内的基因组会呈现两种状态:A区室和B区室[37]。A区室位于细胞核内的基因组活跃区域,基因分布较为密集,基因表达强度高,对应常染色质区域。B区室位于核膜的沉默区域,基因表达强度低,对应异染色质区域。2012年随着测序技术的
【参考文献】:
期刊论文
[1]基于Hi-C技术哺乳动物三维基因组研究进展[J]. 宁椿游,何梦楠,唐茜子,朱庆,李明洲,李地艳. 遗传. 2019(03)
[2]基于Bayesian估计的小波自适应阈值方法对图像进行去噪处理的研究[J]. 曾艺辉,高鸣. 生物医学工程研究. 2018(04)
[3]全基因组染色质相互作用Hi-C文库制备的优化及其质量控制[J]. 张香媛,何超,叶丙雨,谢德健,师明磊,张彦,沈文龙,李平,赵志虎. 遗传. 2017(09)
[4]转录因子和组蛋白修饰的分布特征[J]. 薛高高,张利绒,闫甜甜,刘俊杰. 内蒙古大学学报(自然科学版). 2016(04)
[5]染色质构象解析技术——Hi-C及染色质构象信息提取[J]. 胡文桥,侯越,张峰,刘宏德,孙啸. 基因组学与应用生物学. 2015(11)
[6]小波域高斯混合模型与中值滤波的混合图像去噪研究[J]. 胡晓东,彭鑫,姚岚. 光子学报. 2007(12)
本文编号:2929933
【文章来源】:云南民族大学云南省
【文章页数】:91 页
【学位级别】:硕士
【部分图文】:
Hi-C技术发展动态
第1章绪论5图1.2染色质作用域及域边界检测算法尽管目前的染色质相互作用域检测工具为确定染色质作用域及其边界提供了诸多选择。然而,大多数算法在算法结构或性能上都存在着不同程度的缺陷:例如在识别TAD时要设置很多参数,运算过程较复杂;计算上鲁棒性低导致检测结果差异大,可重复性低;对不同物种或不同分辨率的Hi-C数据不具备普遍适用性等等。从染色质相互作用域及其边界检测的总体发展趋势来看,基于一维统计量的检测模型作为当前领域内出现的最早和最基础的一类算法,仍然极具一定的潜力和研究价值。现有算法模型为染色质作用域及其边界的检测研究提供了更多的分析角度和参考信息,为新算法的提出或迭代改进提供了广阔空间。1.3主要研究工作本文的主要工作是对染色质结构域及其域边界进行有效定位与检测。在深入分析当前染色质结构域边界检测的主要方法基础上,以提高接触域边界的检测定位精度为目标,对基于一维统计量的HiCDB算法和TopDom进行了推陈出新,提出了以绝缘密度为核心的染色质结构域边界检测算法——HiCID。该算法能够在只提供滑动窗口大小的前提下检测出染色质结构域边界所在的位置,并能进一步对结构域、域边界和无相互作用的染色体间隙进行划分。此外,本文最后介绍了应用HiCID算法对染色体结构域和边界位点的基因功能进行研究的结果。
第2章Hi-C数据预处理与染色质作用域检测方法分析9第2章Hi-C数据预处理与染色质作用域检测方法分析2.1引言染色质相互作用域作为染色质的基本结构和功能单元,对基因的调控表达以及基因功能的发挥有着直接的影响。为了对染色质相互作用域的检测识别进行更加深入的研究,本章将从染色质结构及其层次划分、Hi-C数据生成以及常见的几类Hi-C数据预处理算法展开详细介绍,重点介绍了目前在染色质相互作用域检测方法中普遍使用的两类算法:基于一维统计量的检测模型和基于二维接触矩阵的检测模型。2.2染色质结构2.2.1染色质分层结构的划分图2.1染色质间交互热图和细胞核内染色质疆域染色质之间的各基因位点相较于染色质内部有较少的相互作用,因此不同染色质在细胞核中占据不同的疆域,这与在显微镜下观测的结果相一致。2009年首次出现了Hi-C技术,研究者们试图从染色质相互作用矩阵来了解染色质三维构象。Hi-C相互作用矩阵在热图中呈现格子形状。研究发现,细胞核内的基因组会呈现两种状态:A区室和B区室[37]。A区室位于细胞核内的基因组活跃区域,基因分布较为密集,基因表达强度高,对应常染色质区域。B区室位于核膜的沉默区域,基因表达强度低,对应异染色质区域。2012年随着测序技术的
【参考文献】:
期刊论文
[1]基于Hi-C技术哺乳动物三维基因组研究进展[J]. 宁椿游,何梦楠,唐茜子,朱庆,李明洲,李地艳. 遗传. 2019(03)
[2]基于Bayesian估计的小波自适应阈值方法对图像进行去噪处理的研究[J]. 曾艺辉,高鸣. 生物医学工程研究. 2018(04)
[3]全基因组染色质相互作用Hi-C文库制备的优化及其质量控制[J]. 张香媛,何超,叶丙雨,谢德健,师明磊,张彦,沈文龙,李平,赵志虎. 遗传. 2017(09)
[4]转录因子和组蛋白修饰的分布特征[J]. 薛高高,张利绒,闫甜甜,刘俊杰. 内蒙古大学学报(自然科学版). 2016(04)
[5]染色质构象解析技术——Hi-C及染色质构象信息提取[J]. 胡文桥,侯越,张峰,刘宏德,孙啸. 基因组学与应用生物学. 2015(11)
[6]小波域高斯混合模型与中值滤波的混合图像去噪研究[J]. 胡晓东,彭鑫,姚岚. 光子学报. 2007(12)
本文编号:2929933
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/2929933.html