当前位置:主页 > 科技论文 > 基因论文 >

基于多目标的基因表达数据双聚类算法的研究

发布时间:2020-03-19 10:02
【摘要】:基因表达数据分析是生物信息学领域中的一个非常重要的研究方向。基因表达数据不仅包含了非常多基因活跃性的信息,还反映了细胞目前生理状态。寻找基因表达之间的关联关系可以发掘基因间的共同功能、交互关系和协同调控模式等。目前已有许多双聚类算法被提出并应用于挖掘基因表达数据的关联信息。然而还存在不足的地方。第一,它们中很少有重视负关联信息的算法。而负关联信息非常重要,它含有许多隐藏的基因信息。基因表达数据中两个正相关的基因的生物学意义有,两个基因在特定条件下功能相同。而两个负相关的基因的生物学意义有,两个基因在特定条件下两者其中一个起促进作用,而另一个在同一条件下起抑制作用。正关联信息与负关联信息都对生物信息的研究富有意义。第二,领域中缺乏可以对解的质量进行约束,挖掘满足具有一定尺寸的,包含负关联信息的,且具有较强关联性的要求的双聚类解的算法。第三,随着生物信息大数据时代的到来,对双聚类算法的复杂度要求越来越高,而现有算法优化不足。本文针对这些不足的地方提出了用于挖掘基因表达数据的基于多目标的双聚类算法(Multi-objective-based Bi-clustering Algorithm, MOBA),并且将MOBA进行多线程优化。主要研究工作如下:(1)本文提出了MOBA,其设计思想如下:第一步,为了消除数据间的偏差,需要将数据进行预处理,具体做法是将数据进行定性处理并划分为上调、无作用和下调三类;第二步,在计算各个基因的最近邻域之后,将各基因及其最近邻域根据种子(用种子称呼解)结构的设计合并构建初始种子,在构建种子时需根据两个基因的条件的吻合数判定两个基因是负相关还是正相关,初始种子构成初始解集;第三步,计算各种子的最近邻域,将其与其最近邻域合并用以增加双聚类的尺寸(种子扩展),迭代循环第三步直到没有种子需要扩展为止;第四步,通过计算得到的种子的多目标评价函数值筛选最终解。多目标评价函数包含三个子目标:第一个子目标用于最大化双聚类的尺寸;第二个是基于峰谷差的平均平方残基,用以增加负关联信息;第三个是皮尔森相关性系数,用以加强关联性。(2) MOBA算法结构设计的最基本的框架为各个解尺寸的扩展,即种子扩展。该框架非常适合改造为多线程模式。可以通过利用该框架的这种特性,将种子分布到各线程独立运行对MOBA进行多线程化设计。这大大降低了时间复杂度。通过对酵母菌细胞周期数据集的实验可以证明MOBA运行较为稳定可靠,条件聚类较好。MOBA可以发现基因表达数据中显著性较强的基因关联信息,并且同时包含正、负关联信息。
【学位授予单位】:广西大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 岳峰;孙亮;王宽全;王永吉;左旺孟;;基因表达数据的聚类分析研究进展[J];自动化学报;2008年02期

2 王祥林;;基于矩阵变换的层次聚类在基因表达数据分析中的应用研究[J];计算机光盘软件与应用;2012年24期

3 陆媛;杨慧中;;基于代表熵的基因表达数据聚类分析方法[J];计算机工程与应用;2008年27期

4 缪苗;尚学群;刘加财;王淼;;从基因表达数据中挖掘最大的行常量双聚类[J];计算机应用研究;2011年12期

5 李小梅;郭红;;基因表达数据的模糊聚类技术研究[J];信息系统工程;2010年11期

6 李颖新,刘全金,阮晓钢;一种肿瘤基因表达数据的知识提取方法[J];电子学报;2004年09期

7 王鑫;蒋华;;基于改进Multi-Agent系统的基因表达数据的分析与研究[J];计算机工程与设计;2008年09期

8 朱思峰;刘芳;柴争义;;免疫聚类算法在基因表达数据分析中的应用[J];北京邮电大学学报;2010年02期

9 郭红;蔡莉;;采用多目标微分进化算法的基因表达数据双向聚类[J];小型微型计算机系统;2010年10期

10 石玉;李慧敏;兰社云;;基于稀疏极大边界特征的癌症基因表达数据分析[J];郑州师范教育;2012年04期

相关会议论文 前1条

1 杨昆;李建中;王朝坤;徐继伟;;基因表达数据的基于类别树和SVMs的多类癌症分类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

相关博士学位论文 前8条

1 张焕萍;面向基因表达数据的致病基因挖掘方法研究[D];南京航空航天大学;2009年

2 蔡瑞初;基因表达数据挖掘若干关键技术研究[D];华南理工大学;2010年

3 刘亚杰;基于智能优化算法的肿瘤微阵列基因表达数据分类研究[D];云南大学;2014年

4 陆慧娟;基于基因表达数据的肿瘤分类算法研究[D];中国矿业大学;2012年

5 张丽娟;微阵列基因表达数据分类问题中的属性选择技术研究[D];国防科学技术大学;2008年

6 毛志毅;基因表达数据基因筛选与近红外光谱微量成分模型优化方法研究[D];南开大学;2014年

7 张琛;基因芯片数据处理与分析方法研究[D];吉林大学;2011年

8 程慧杰;基于模式识别方法的基因表达数据分析研究[D];哈尔滨工程大学;2012年

相关硕士学位论文 前10条

1 李科;EMD去噪算法研究及其在结肠癌基因表达数据集中的应用[D];陕西师范大学;2015年

2 田小龙;基于智能优化计算的双聚类算法研究[D];西安电子科技大学;2014年

3 晋飞鸣;基于ELM的肿瘤基因表达数据分类算法研究[D];东北大学;2013年

4 严晶;基因表达数据的合并双向聚类算法[D];湘潭大学;2015年

5 周静;一种基于多维基因组数据的基因功能模块的识别方法[D];黑龙江大学;2015年

6 高雪峰;膜计算在基因表达数据分析中的应用[D];西华大学;2015年

7 陈辉辉;基于基因表达数据的信息基因选择研究[D];山东大学;2016年

8 梁妍;基于多目标的基因表达数据双聚类算法的研究[D];广西大学;2016年

9 李靖;基于支持向量机的基因表达数据降维方法的研究[D];苏州大学;2011年

10 王海鹏;基因表达数据分析的若干问题研究[D];杭州电子科技大学;2011年



本文编号:2590078

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/2590078.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0fd16***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com