当前位置:主页 > 科技论文 > 软件论文 >

基于平滑LDA的RNA-Seq数据分析研究

发布时间:2017-12-01 15:37

  本文关键词:基于平滑LDA的RNA-Seq数据分析研究


  更多相关文章: RNA-Seq 基因异构体表达水平 平滑LDA 结合区 多源映射 非均匀性 KL散度 差异异构体比例


【摘要】:随着下一代高通量DNA测序技术的快速发展,RNA-seq技术逐渐成为了转录组学研究的基本实验手段。相比传统的基因芯片技术,RNA-seq技术具有高信噪比,高灵敏度,所需样本少等特点。但是利用RNA-seq技术进行表达水平估计时仍然存在很多挑战,比如读段的多源映射和非均匀分布等问题。本文针对上述问题,提出了一个转录组表达水平估计方法sLDASeq。该模型根据基因中转录本注释信息对模型参数进行约束,对跨结合区的读段按长度分配处理,解决了读段跨结合区问题,并在模型中考虑了外显子的稀疏问题。另外sLDASeq模型引入代表异构体表达水平的隐含变量,对读段在异构体和外显子上分布进行建模,从而解决读段在参考序列分布非均匀问题。通过模拟数据集和多个真实数据集的验证,相比与其它主流方法,s LDASeq方法能获得较为准确的基因和异构体表达水平。在RNA-seq数据分析中,最基本的研究目的是寻找样本中差异表达的基因和异构体。但目前大多数方法都是识别单个异构体的差异表达,无法同时检测同一个基因中所包含异构体表达比例的差异。因此本文提出了一个差异异构体比例检测方法。该方法基于我们设计的sLDASeq模型,运用该模型中隐含变量的概率分布,采用KL散度进行差异异构体比例的分析。通过模拟和真实数据集的验证,sLDASeq方法能准确的估计基因中异构体的比例。此外在模拟数据集上,sLDASeq方法通过KL散度能准确检测出差异异构体比例。
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:Q811.4;TP311.13


本文编号:1241623

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1241623.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户42943***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com