基于双线性回归的单细胞测序数据去噪算法研究
发布时间:2020-06-11 20:46
【摘要】:在单细胞RNA测序技术还未兴起之前,大家熟知并利用的是bulk RNA测序技术,即计算基因在所有细胞中表达的平均值。但这样的数据缺失了基因在不同细胞上表达的异质性。后来随着科技的发展,单细胞RNA测序技术被提出。单细胞RNA测序技术能够在单细胞水平上对整个转录组进行分析,在许多生物学和医学应用中具有巨大的前景。尽管单细胞RNA测序技术给未来单细胞数据分析提供了很好的技术支持,但因为技术问题,单细胞数据中一些低表达值或中表达值可能会无法完全观测到,导致其表达值为0或有某种程度的减少,我们称其为dropout效应。再加上单细胞数据的稀疏特性,测序数据中的高比例0值影响了后续分析,所以对单细胞数据进行填充就成了在进行后续分析之前的一个重要步骤。本文提出双线性回归的填充技术,首先构造具有先验信息的相似矩阵,为接下来的双回归系数筛选子集,然后通过迭代进行行和列的加入稀疏惩罚的线性回归进行估计,将达到收敛条件的估计值作为最终填充值。后续数据分析表明,scBiLR能够准确恢复dropout影响下的缺失值,有助于改进后续分析,比如差异表达分析和聚类分析。
【图文】:
A逦X逡逑图3.1双线性回归图示逡逑若仅仅只对单细胞测序数据进行细胞层面的回归或基因层面的回归,即逡逑每一个细胞都作为被解释变量由其他细胞进行回归运算或每一个基因都作逡逑为被解释变量由其他基因进行回归运算,,目标函数应该如下:逡逑-==
差异基因同前150个标准差异基因的交集个数T叩250
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:C81
【图文】:
A逦X逡逑图3.1双线性回归图示逡逑若仅仅只对单细胞测序数据进行细胞层面的回归或基因层面的回归,即逡逑每一个细胞都作为被解释变量由其他细胞进行回归运算或每一个基因都作逡逑为被解释变量由其他基因进行回归运算,,目标函数应该如下:逡逑-==
差异基因同前150个标准差异基因的交集个数T叩250
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:C81
【相似文献】
相关期刊论文 前10条
1 李法君;;降解组测序技术及其研究进展[J];生物学教学;2017年04期
2 彭桂兰;陈嘉慧;荣丹箐;;第四代测序技术[J];农村经济与科技;2017年10期
3 王海;;高通量测序技术新名词的理解和辨析[J];中国科技术语;2017年04期
4 权冰娥;李树;;新一代DNA测序技术在法医实践中的应用及其研究进展[J];辽宁警察学院学报;2017年06期
5 郑秋燕;李清;毛华明;冷静;;测序技术的发展对瘤胃元基因组研究的影响[J];黑龙江畜牧兽医;2015年21期
6 韩齐;李媛媛;孙方达;孔保华;陈倩;;新一代测序技术在食品微生物学中的应用[J];食品工业;2016年01期
7 杜兵兵;;第二代高通量测序技术的原理及其在医学中的应用进展[J];中国继续医学教育;2016年03期
8 周莹;许冰莹;;二代测序技术在临床医学上的相关应用[J];昆明医科大学学报;2016年03期
9 乌日拉嘎;徐海燕;冯淑贞;孙志宏;孟和毕力格;张和平;;测序技术的研究进展及三代测序的应用[J];中国乳品工业;2016年04期
10 郭海燕;程国虎;李拥军;张昊;秦康乐;;高通量测序技术及其在生物学中的应用[J];当代畜牧;2016年12期
相关会议论文 前10条
1 赵洁;赵志军;贾伟;师志云;赵颖;张玉英;赵s
本文编号:2708435
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2708435.html