基于单细胞测序数据的细胞亚型发现研究
发布时间:2020-06-19 01:51
【摘要】:随着单细胞测序技术的进步,已经有越来越多单细胞层面的转录数据。借助这些单细胞数据我们可以深入了解细胞异质性和细胞层面的潜在机制。但数据的复杂性给我们带来众多挑战。对于细胞识别、聚类和功能发现可以通过特殊的转录信号在单分子层面得到很好的认识。最常用的方法是根据基因表达水平,判断同属于一类型的细胞,此类研究基于一个生物学假设即:基因表达水平决定其功能蛋白的合成,相似的基因表达水平有可能合成相似的功能蛋白。由此可见,对单细胞数据进行聚类具有十分重要的医学意义。目前针对单细胞数据聚类问题,已经提出了一些方法,比如pcaReduce生成层次模型、t-SNE非线性降维、考虑dropout影响的ZIFA模型、考虑稀有类型的Racel D模型、网络聚类snn-clique模型等等。尽管上述论文已经从不同方面解决聚类问题,但众多论文都没有对低丰度基因进行筛选。已有论文证实低丰度基因将会提高数据的维度,而且对聚类结果有一定的影响。论文具体针对snn-clique模型中qqaasi-clique的筛选具有忽略网络整体连接性的问题。clusterone模型中可以通过引入对内部边和外部边综合考量的内聚力(cohesiveness),从而避免对整体和局部节点度考虑不平衡的研究。本篇论文根据上述两者的优缺点将snn邻接图和基于内聚力引导的搜索聚类算法clusterone结合一起,提出snn-clusterone模型。他可以自动确定数据的聚类数量,此外利用rank的思想避免高维数据聚类的不适情况,并且在一定程度上避免snn-clique在网络整体连接性的缺陷。通过模拟数据验证snn-clusterone具有高鲁棒性,在模拟数据的结果上的聚类结果此模型优于snn-clique,在真实数据中,发现在基于多种距离情况下,snn-clusterone的结果在多种聚类评价指标下都高于snn-clique,说明此模型通过基因筛选和从整体连接性考虑,可以得到更好的聚类效果。
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:C81
【图文】:
1:预处理后的单细胞数据通过传统的距离刻画相似性矩阵,然后根据共享最近邻算法(Wi断节点之间是否存在连接权重,对存在权重的节点对计算权重大小,最终生成SNN连接图。逡逑定义KNN逦计算数据集叉的相似矩阵(欧式距离或其他任何距离)并排本而到其他样本的距离按照升序,令第个距离记为4^,则样本而的前fc离用KiViVbi)表示并记作:逡逑KNN(xi)邋=邋{Xj邋e邋Xldixuxj)邋<邋dki},逦(2.定义edge(Xi,x/)计算x;和%的是否有边,当且仅当在:^和%的中至少有一个共享的节点时,则而和之间有3邋edge(Xi,邋Xj、\KNN(Xi)邋D邋KNN(Xj)子邋0,逦(2.定义edge权重edge(;Ti,;Ej)的权重被定义为A:和if_/V7V中平均ranA:差值高值:逡逑edge(xi,邋Xj)邋—邋max{k邋—邋-(rank{v,Xi)邋+邋rank(v,Xj))),逦(2.
丨硕士学位论文逡逑MASTER’S邋THESIS逡逑两个子图的节点数和边数都相同,r*邋=邋f,邋A:邋=邋8,但是观察两个子图,左图中逡逑guasi-digue可以很好的刻画复杂网络的紧密性可是对于右图,^tasi-digue并不逡逑能很好的刻画子图的连接,在复杂网路中guasi-digue由于只考虑节点度数而忽逡逑略整体的连通性,所以并不能很好的刻画子图的密度结构,而duderone提出的逡逑内聚力可以很好的提升这方面性能。逡逑
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:C81
【图文】:
1:预处理后的单细胞数据通过传统的距离刻画相似性矩阵,然后根据共享最近邻算法(Wi断节点之间是否存在连接权重,对存在权重的节点对计算权重大小,最终生成SNN连接图。逡逑定义KNN逦计算数据集叉的相似矩阵(欧式距离或其他任何距离)并排本而到其他样本的距离按照升序,令第个距离记为4^,则样本而的前fc离用KiViVbi)表示并记作:逡逑KNN(xi)邋=邋{Xj邋e邋Xldixuxj)邋<邋dki},逦(2.定义edge(Xi,x/)计算x;和%的是否有边,当且仅当在:^和%的中至少有一个共享的节点时,则而和之间有3邋edge(Xi,邋Xj、\KNN(Xi)邋D邋KNN(Xj)子邋0,逦(2.定义edge权重edge(;Ti,;Ej)的权重被定义为A:和if_/V7V中平均ranA:差值高值:逡逑edge(xi,邋Xj)邋—邋max{k邋—邋-(rank{v,Xi)邋+邋rank(v,Xj))),逦(2.
丨硕士学位论文逡逑MASTER’S邋THESIS逡逑两个子图的节点数和边数都相同,r*邋=邋f,邋A:邋=邋8,但是观察两个子图,左图中逡逑guasi-digue可以很好的刻画复杂网络的紧密性可是对于右图,^tasi-digue并不逡逑能很好的刻画子图的连接,在复杂网路中guasi-digue由于只考虑节点度数而忽逡逑略整体的连通性,所以并不能很好的刻画子图的密度结构,而duderone提出的逡逑内聚力可以很好的提升这方面性能。逡逑
【相似文献】
相关期刊论文 前10条
1 李法君;;降解组测序技术及其研究进展[J];生物学教学;2017年04期
2 彭桂兰;陈嘉慧;荣丹箐;;第四代测序技术[J];农村经济与科技;2017年10期
3 王海;;高通量测序技术新名词的理解和辨析[J];中国科技术语;2017年04期
4 权冰娥;李树;;新一代DNA测序技术在法医实践中的应用及其研究进展[J];辽宁警察学院学报;2017年06期
5 郑秋燕;李清;毛华明;冷静;;测序技术的发展对瘤胃元基因组研究的影响[J];黑龙江畜牧兽医;2015年21期
6 韩齐;李媛媛;孙方达;孔保华;陈倩;;新一代测序技术在食品微生物学中的应用[J];食品工业;2016年01期
7 杜兵兵;;第二代高通量测序技术的原理及其在医学中的应用进展[J];中国继续医学教育;2016年03期
8 周莹;许冰莹;;二代测序技术在临床医学上的相关应用[J];昆明医科大学学报;2016年03期
9 乌日拉嘎;徐海燕;冯淑贞;孙志宏;孟和毕力格;张和平;;测序技术的研究进展及三代测序的应用[J];中国乳品工业;2016年04期
10 郭海燕;程国虎;李拥军;张昊;秦康乐;;高通量测序技术及其在生物学中的应用[J];当代畜牧;2016年12期
相关会议论文 前10条
1 赵洁;赵志军;贾伟;师志云;赵颖;张玉英;赵s
本文编号:2720138
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2720138.html