当前位置:主页 > 科技论文 > 搜索引擎论文 >

基因表达数据中基于机器学习的关键lncRNA预测研究

发布时间:2020-08-09 09:01
【摘要】:随着基因组学和生物信息学的飞速发展,越来越多的研究证明IncRNA广泛参与了大量生物学调控过程,尤其是在人类疾病的发生、发展和防治中扮演着重要角色。在海量基因表达数据中对IncRNA进行特征挖掘与功能预测已成为学术界和工业界共同关注的热点。特别是对与疾病密切相关的关键IncRNA进行预测,能够揭示疾病成因与机制,具有极高的生物医学价值。然而IncRNA基因表达数据规模庞大、结构复杂,从中精确定位少量的关键IncRNA是一个巨大的挑战。机器学习因其优秀的解决问题与自主学习能力,成为解决IncRNA特征挖掘与功能预测问题的一大利器。本课题针对基因表达数据中的关键IncRNA预测,进行了相关的调查、研究、实验和分析;引入机器学习技术,融合BPSO智能算法与ELM学习算法提出了-一种新型智能预测模型,实现了关键IncRNA预测系统并开展相关实验,具有重要的学术意义。本文主要工作如下:(1)对基因表达数据中关键IncRNA预测的研究策略进行调研从IncRNA表达数据的特性与基因表达数据研究策略出发,对常见的基因特征选择框架进行介绍、分析和比较,并将关键IncRNA进行了数据分析角度定义,递进地阐述了基因表达数据中预测关键IncRNA的研究思路与整体策略。(2)构建一种高效、精确、自适应能力强的关键IncRNA预测模型提出一种基于改良二进制粒子群算法和极限学习机的关键IncRNA预测模型(改良BPSO-ELM预测模型):采用BPSO算法对IncRNA特征组合优化问题进行求解,同时利用ELM对每组候选IncRNA子集进行评价,并反馈给粒子群,指导粒子群朝着最优位置移动,能够高效地完成关键IncRNA的确定。(3)模型研发、验证与评估采集乳腺浸润性癌、结肠腺癌和肺腺癌数据三个典型数据集开展实验。对实验的各种参数进行了精确调整,并从统计学、算法对比、生物信息学三个角度对我们的实验结果进行分析。模型在三个数据集上都能取得较好的效果,仅需选取10个关键IncRNA即可对样本的患病状况实现93.5%以上的预测精度,且与其他经典方法相比具有明显的速度优势。
【学位授予单位】:福州大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP181;Q811.4
【图文】:

基因表达谱,基因芯片


逦福州大学工程硕士学位论文逦逡逑1.2国内外研究现状逦?逡逑lncRNA最初被认为是基因转录产生的欺骗性副产物,无法行使生物学功能,逡逑但是受到RNA编辑现象的启示,越来越多专家学者开始关注这一神秘分子逡逑自2009年起,一系列工作表明,IncRNA不仅广泛存在于各种生物,而且可以在逡逑多种水平影响着基因表达,在生命活动的不同领域发挥调控作用18]。现阶段,逡逑IncRNA基因芯片技术发展趋于成熟稳定,已经能很好地解决传统核酸印迹杂交逡逑技术操作繁琐、自动化程度低、无法批量检测等不足。应用基因芯片技术设计不逡逑同探针进行实验能准确快捷地生成海量IncRNA信息,为IncRNA研宄提供了可逡逑靠的数据支持。因此对IncRNA的研宄从复杂、繁琐、效率低的传统杂交技术操逡逑作,逐渐转向对海量IncRNA表达数据进行挖掘分析的生物信息学研宄。逡逑

组织结构图,组织结构,论文


测模型和其他经典方法进行比较,验证预测模型的性能。逡逑总结与展望:总结全文工作内容,展望下一步工作。逡逑整体组织结构如图1-2所示:逡逑〔逦第二章研究策略逡逑^(关键IncRNA与基达数据特征选择逡逑f逦第三章核心^术介绍与优化邋^逡逑^邋(二进制粒子群算法与极限学习机)」逡逑f逦第四章数彳Z采集与分析逦^逡逑I邋(数据采集、分g与数据预处理)J逡逑I逡逑f逦第五章系统设计逡逑初步特征选择、改良BPSO-ELM关键丨ncRNA预测模型)^逡逑"""逦暴逦—逡逑( ̄第六章£验分析 ̄^逡逑、(模型性能分析与比较)J逡逑f逡逑总结与展望I逡逑V逦J逡逑图1-2论文组织结构逡逑6逡逑

框架模型


逦基因表达数据中基于机器学习的关键IncRNA预测研究逦逡逑本的分类效果来评估基因对样本患病情况的影响程度。目前在DNA与疾病关系逡逑研究领域,己有较多的学者专家进行了相关的研究。例:文献[42]提出了一种基于逡逑输出不一致测度的极限学习机集成算法,该研宄方法在经典白血病数据集【43Ul能逡逑以少量的关键基因取得较稳定的预测效果。Wrapper框架模型如下所示:逡逑/

【相似文献】

相关期刊论文 前10条

1 王长本,刘兴晖,王伟灵,周新;基因表达数据的聚类分析[J];国外医学(临床生物化学与检验学分册);2004年04期

2 王修竹;刘自伟;齐阳;鲍竞;;基因表达数据的预处理方法[J];兵工自动化;2006年07期

3 孔薇;牟晓阳;;基于大脑不同区域的阿尔茨海默症基因表达数据分析[J];上海交通大学学报;2013年06期

4 马李冰;侯艳;李贞子;李康;;多步骤决策树方法在基因表达数据上的应用研究[J];中国卫生统计;2017年01期

5 庄振华;王年;李学俊;梁栋;王继;;癌症基因表达数据的熵度量分类方法[J];安徽大学学报(自然科学版);2010年02期

6 刘英;;蛋白质网络和基因表达数据与癌症转移的预测[J];国际药学研究杂志;2008年02期

7 顾明亮;为基因表达数据的发表制订标准[J];基础医学与临床;2002年04期

8 刘珑龙;周西龙;刘雪峰;;基于遗传算法和学习向量化网络的基因表达数据的阈值分析[J];中国海洋大学学报(自然科学版);2013年12期

9 孔薇;陶伟杰;牟晓阳;;基于非负矩阵分解的大脑不同区域基因表达数据分析[J];中国生物医学工程学报;2012年06期

10 赵洁茹;;浅谈模式识别中的支持向量机技术分析肿瘤基因表达数据[J];科技资讯;2011年33期

相关会议论文 前8条

1 刘会娟;侯艳;李康;;ARTIVA在时间序列基因表达数据网络构建中的应用[A];2017年中国卫生统计学学术年会论文集[C];2017年

2 杨昆;李建中;王朝坤;徐继伟;;基因表达数据的基于类别树和SVMs的多类癌症分类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

3 霍煜;袁德成;;基于PCA和DE-ELM的肝癌基因表达数据分析[A];2018中国自动化大会(CAC2018)论文集[C];2018年

4 崔光照;曹祥红;张华;;基于小波变换的基因表达数据去噪聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年

5 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年

6 冯晶;夏冉;曾勇华;刘娟;周怀北;;肿瘤基因表达数据库系统[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

7 梅桢;申琦;冶保献;;用于基因表达数据模式识别的KNN和SVM集成算法[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

8 王章辉;赵宇海;王国仁;李源;;一种基于投影聚类的无监督表型区分算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

相关博士学位论文 前10条

1 姜涛;基因表达数据挖掘关键技术研究[D];西北工业大学;2016年

2 陆慧娟;基于基因表达数据的肿瘤分类算法研究[D];中国矿业大学;2012年

3 张丽娟;微阵列基因表达数据分类问题中的属性选择技术研究[D];国防科学技术大学;2008年

4 黄德生;基因表达数据在肿瘤诊断、基因功能预测中的应用研究[D];中国医科大学;2009年

5 刘亚杰;基于智能优化算法的肿瘤微阵列基因表达数据分类研究[D];云南大学;2014年

6 王文俊;基因表达数据的相似性度量和特征提取研究[D];西安电子科技大学;2011年

7 毛志毅;基因表达数据基因筛选与近红外光谱微量成分模型优化方法研究[D];南开大学;2014年

8 杨博;基因调控网络构建及在癌症基因预测中的应用[D];西安电子科技大学;2014年

9 殷路;基因表达数据的双聚类分析与研究[D];电子科技大学;2017年

10 石金龙;基因表达及其转录调控机制的计算分析[D];国防科学技术大学;2010年

相关硕士学位论文 前10条

1 吴韵怡;基于深度学习的基因表达数据处理在药效预测上的应用[D];哈尔滨工业大学;2019年

2 杨磊;面向基因表达数据的代价敏感学习优化方法[D];中国计量大学;2018年

3 侯永杰;基于规则的跨平台基因表达数据分类研究[D];广东工业大学;2019年

4 刘煜;基因表达数据中基于机器学习的关键lncRNA预测研究[D];福州大学;2018年

5 宋飞豹;遗传聚类算法的改进及其在基因表达数据分析中的应用[D];安徽大学;2019年

6 杨烩婷;双聚类算法及其在基因表达数据分析中应用研究[D];吉林大学;2019年

7 刘圣辉;基于基因表达数据的新型特征提取算法研究[D];山东大学;2018年

8 夏春秋;融合自训练和低秩表示的基因表达数据癌症分类方法[D];南京理工大学;2018年

9 余显学;基于基因表达数据的癌症亚型发现双聚类方法研究[D];西南大学;2018年

10 刘鸿儒;面向基因表达数据快速聚类的算法研究[D];哈尔滨工业大学;2018年



本文编号:2786904

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2786904.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户45762***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com