当前位置:主页 > 管理论文 > 统计学论文 >

差异分析算法研究与软件平台开发

发布时间:2020-11-08 19:10
   随着基因图谱绘制完成后,生物信息学领域也开始在分子水平上研究细胞的功能机理和复杂疾病的遗传机制。近些年快速发展的高通量测序技术带来了海量的基因测序数据,这为从基因组学的视角研究人类生命活动规律和疾病发生发展机制提供了新的机遇。另外,在机器学习领域,研究人员已提出了一些差异分析模型与算法,这为从基因组学数据挖掘致病基因提供了强有力的理论工具和技术支撑。在这些研究的基础之上,本文展开了如下两点研究:(1)提出了一个基于交互线性回归的差异网络构建算法。(2)开发了一个面向单细胞测序数据的差异表达基因识别的R软件包。主要贡献点如下:1.为了集成不同平台的转录组学数据并挖掘导致基因网络扰动的关键基因,本文提出了一个基于交互线性回归模型的差异网络构建方法。其模型借助群组稀疏正则化思想探索不同平台数据之间的共性并挖掘网络扰动的相关基因。本文也提出了一个基于交替方向乘子算法(Alternating Direction Method of Multipliers)求解该模型。模拟实验验证了本文所提出模型的有效性。本文也将该模型应用于proneural亚型和mesenchymal亚型癌症基因表达数据中,并构建两类癌症亚型之间的差异网络。实验结果显示所识别差异网络中的hub基因具有重要的生物功能。2.本文开发了一个集成面向单细胞测序数据的差异基因识别算法的应用软件平台。基于R语言,该平台整合了当前主流的面向单细胞数据的差异基因识别算法。其贡献如下:(1)用统一的输入输出格式整合了多种算法,方便用户进行单细胞差异表达分析和对比不同算法之间的优劣。(2)开发了相关的下游分析功能,如Gene Ontology富集分析和KEGG通路富集分析等。(3)开发了R软件包和Shiny Application,提供了便利的操作界面。
【学位单位】:华中师范大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:C81
【部分图文】:

视角,样本量,矩阵,数据


图1:顶部:L个视角,每个视角下样本量为n的数据,糢型可同时处理L个视角的数??据。⑴淡紫色矩阵:n个pxp个方阵按列排列,形成npxp的样本矩阵。(%)绿黄色??矩阵:系数矩阵,排列方式与淡紫色矩阵相同。图中虚线表示不同视角之间的矩??阵有共同信息。底部:左边的部分,为单个视角下的线性交互回归的计算形式。其??中表示姐阵之间的内积,?对于右边的部分,表??\?'?j=l?k=l??示交互系数矩阵的形式,以及矩阵的维度。图形中相同颜色即代表同一个矩阵。红??色代表响应变量,淡紫色代表样本矩阵,黄绿色代表交互系数矩阵。??组,通过Group?Lasso正则化,使其L个视角的网络具有相同的结构。??(2)1^?[44]可以使参数岛产生稀疏结构,在(2.3)和(2.4)的共同限制下,与hub节点??相连的边可产生稀疏结构。??将线性交互模型,Group?Lasso以及Row-Column?overlap惩罚结合,本文提出??了基于节点的多视角线性交互模型(CcnPerturbed?node?Joint?Linear?Interaction??

曲线,弹性网,不同参数,脑瘤


图2:不同参数设置下的弹性网和C/Vi//?表现效果的比较。其中,不同行代??表不同的样本量,不同的列表示不同的/m&节点。对于C/VLZR,每幅图中的不??同颜色曲线对应固定Ai的值,不同的》2。弹性网的曲线根据不同的Amas&值,使??用GZmnrf包绘制。以上结果为重复50次,计算均值所得结果。??2.4恶性胶质脑瘤数据分析??2.4.1恶性胶质瘤数据获取??恶性胶质瘤是第一个被TCGA系统研宄的癌症类型,现已知的恶性胶质瘤种??类有4?种:classical,?proneural,?mesenchymal,neural?[61]。proneural类脑瘤很大??概率是由于基因TP53,?PDGFRA,?IDH1引起的,mesenchymal类脑瘤大多和基??因XF1突变相联系。我们将CP^JLIR应用于TCGA数据,以获取两类脑瘤之间基??因交互模式的差异,以发现引起子类变化的重要因素。首先,从Cancer?Genome??Atlas(TCGA,?Version:Februaxy?27?2016)网站获取neural类和mesenchymal类的基因??表达数据。在本次研究中,数据包括3种mRNA,2种copy?number?change数据。其??中,3种mRNA数据来源于3个平台,分别为gilent?244KCustomGeneExpression??G450.?Affymetrix?HT?Human?Genome?U133?Array?Plate?Set^DAffymetrix?Human??

流程图,硕士学位论文,流程图


图4:?scZ)Ei4流程图??24??
【相似文献】

相关期刊论文 前10条

1 ;MNNG致小鼠肢体异常发育差异表达基因的筛选和鉴定[J];癌变.畸变.突变;2001年04期

2 李刚,寿江;寻找差异表达基因的新方法:mRNA差异显示[J];国外医学(放射医学核医学分册);1997年03期

3 赵勇,丁金凤;寻找差异表达基因[J];国外医学.遗传学分册;2000年02期

4 李炜弘;许嗣立;张天娥;丁维俊;黄禹峰;曾跃琴;谭雪菊;;老龄肾阳虚证差异表达基因的筛选与鉴定[J];辽宁中医杂志;2012年04期

5 任丽萍;章琳;洪贵妮;郭政;;基于蛋白质互作评价差异表达基因的重复性[J];生物信息学;2011年03期

6 王学,徐静;一种鉴别基因差异表达的新方法——差异表达mRNA呈现技术[J];生物工程进展;1998年03期

7 戴建新,孙树汉;差示RT-PCR克隆寄生虫差异表达基因的新策略[J];中国寄生虫学与寄生虫病杂志;1997年05期

8 唐荐;魏小华;;长链非编码RNA在膝关节骨性关节炎患者和健康人PBMCs中的差异表达及其发病机制研究[J];中国现代药物应用;2019年14期

9 蒋定锋;潘娟娟;赵耐青;;差异表达基因筛选方法的比较[J];中国卫生统计;2006年05期

10 齐鲁;丁彦青;;基于差异表达基因探索大肠癌早期转移相关分子机制[J];中国科学:生命科学;2013年07期


相关博士学位论文 前10条

1 袁敏;长链非编码RNA在类风湿关节炎中的差异表达和相关性研究[D];山东大学;2018年

2 王一衡;大白菜四倍体形态变异的分子机制研究[D];沈阳农业大学;2018年

3 许芳;原发性胆汁性胆管炎的转录组学研究[D];吉林大学;2019年

4 唐尧;SEPT家族基因异常表达在食管鳞癌中的临床意义及作用机制[D];北京协和医学院;2017年

5 姚颖垠;小麦杂交种与亲本之间差异表达基因的分离、克隆与功能鉴定[D];中国农业大学;2005年

6 苑纯秀;日本血吸虫发育期别差异表达基因的筛选研究及新基因的克隆分析[D];中国农业科学院;2005年

7 胡国章;利用生物信息学方法筛选胶质瘤的差异表达基因及其相关机制[D];吉林大学;2015年

8 齐湘杰;高恶性膀胱移行细胞癌与相应正常上皮差异表达基因的克隆及功能研究[D];天津医科大学;2003年

9 张晓文;银杏雌雄花芽差异表达基因研究[D];山东农业大学;2014年

10 戚大川;应用基因芯片筛选胆管癌相关差异表达基因及对其功能的研究[D];苏州大学;2015年


相关硕士学位论文 前10条

1 李会生;差异分析算法研究与软件平台开发[D];华中师范大学;2019年

2 李泽宏;不同处理条件下银杏miRNA的测序结果及表达特点分析[D];武汉轻工大学;2018年

3 倪正强;牦牛、黄牛舌尖的比较转录组学分析[D];兰州大学;2017年

4 苏比奴尔·艾力;塔里木马鹿毛色差异表达基因筛选及功能的研究[D];新疆大学;2019年

5 方春晓;新疆汉族食管鱗癌mRNA差异表达基因的筛选[D];石河子大学;2018年

6 李佼旬;基因芯片筛选非综合征型唇腭裂差异表达基因的初步研究[D];重庆医科大学;2018年

7 张媛媛;家蚕杂种优势的蛋白组学与转录组学研究[D];江苏大学;2018年

8 孙梦梦;基于粒计算的疾病差异表达基因研究[D];江南大学;2018年

9 何聪;非酒精性脂肪肝病的血清miRNA差异表达谱的初步研究[D];江苏大学;2017年

10 王菁菁;食管鳞癌中差异表达的lncRNA的筛选及分析[D];江苏大学;2017年



本文编号:2875209

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2875209.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户245ec***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com