双聚类算法及其在基因表达数据分析中应用研究
发布时间:2023-05-10 05:05
传统的单聚类方法得到的是在所有实验条件下相似度高的基因集,而针对真实的基因表达数据来说,提取部分基因集在部分条件下高度相似的子矩阵更有意义。因为当考虑了所有的实验条件,有些本来相似的基因会因为相似度达不到阈值而不能处于同一个集合中,而且在真实的生物活动中,基因可以参与多个生物活动,但并非在所有的条件下处于调控状态,所以将注意力集中在局部信息更有利于得到符合真实情况的信息。面对传统单聚类的缺点产生了双聚类分析方法。本文的主要研究工作是对双聚类算法进行改进,然后将算法运用于基因表达数据去得到变化相关的双聚类,最后从双聚类中获得信息和知识来帮助生物学研究。本文提出了一种新的双聚类算法YUNIBIC。YUNIBIC的步骤主要分为以下几步:首先根据原始矩阵构建对应的索引矩阵,并应用最长公共子序列算法在索引矩阵行对之间来选择满足条件的基因构成双聚类种子;随后添加相关行列来扩展种子。最后,使用斯皮尔曼双聚类评估方法(SBM)作为双聚类质量的评价函数来筛选最后的双聚类作为输出。本文提出构建行为矩阵来进行双聚类相关行的添加,通过这种方法还可以添加与双聚类具有负相关表达模式的行。此外,在面对基因表达数据这...
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 论文研究背景和意义
1.2 双聚类算法国内外研究现状
1.3 本文的主要工作
1.4 论文的组织结构
第2章 双聚类
2.1 双聚类介绍
2.2 双聚类类型
2.3 双聚类结构
2.4 双聚类算法评价方法
2.5 本章小结
第3章 YUNIBIC算法介绍
3.1 数据预处理
3.1.1 数据分离
3.1.2 数据重赋值
3.2 种子的选取
3.3 将种子扩增为最终双聚类种子
3.4 添加行和列扩展双聚类
3.5 筛选较优的双聚类
3.6 本章小结
第4章 实验和讨论
4.1 模拟数据实验
4.1.1 数据选择
4.1.2 数据验证方法
4.1.3 参数选择
4.1.4 实验结果和讨论
4.2 真实数据实验
4.2.1 数据选择
4.2.2 数据验证方法
4.2.3 参数选择
4.2.4 实验结果和讨论
4.3 本章小结
第5章 基于GTK+的YUNIBIC算法可视化界面设计
5.1 GTK+介绍
5.2 GTK+设计流程
5.2.1 程序入口及初始化
5.2.2 控件
5.2.3 信号与回调函数
5.2.4 编译以及执行
5.3 Glade简介
5.4 YUNIBIC算法界面设计
5.4.1 界面显示模块
5.4.2 消息控制模块
5.4.3 功能实现模块
5.5 本章小结
第6章 结论与展望
6.1 总结
6.2 展望
参考文献
作者简介
致谢
本文编号:3813089
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 论文研究背景和意义
1.2 双聚类算法国内外研究现状
1.3 本文的主要工作
1.4 论文的组织结构
第2章 双聚类
2.1 双聚类介绍
2.2 双聚类类型
2.3 双聚类结构
2.4 双聚类算法评价方法
2.5 本章小结
第3章 YUNIBIC算法介绍
3.1 数据预处理
3.1.1 数据分离
3.1.2 数据重赋值
3.2 种子的选取
3.3 将种子扩增为最终双聚类种子
3.4 添加行和列扩展双聚类
3.5 筛选较优的双聚类
3.6 本章小结
第4章 实验和讨论
4.1 模拟数据实验
4.1.1 数据选择
4.1.2 数据验证方法
4.1.3 参数选择
4.1.4 实验结果和讨论
4.2 真实数据实验
4.2.1 数据选择
4.2.2 数据验证方法
4.2.3 参数选择
4.2.4 实验结果和讨论
4.3 本章小结
第5章 基于GTK+的YUNIBIC算法可视化界面设计
5.1 GTK+介绍
5.2 GTK+设计流程
5.2.1 程序入口及初始化
5.2.2 控件
5.2.3 信号与回调函数
5.2.4 编译以及执行
5.3 Glade简介
5.4 YUNIBIC算法界面设计
5.4.1 界面显示模块
5.4.2 消息控制模块
5.4.3 功能实现模块
5.5 本章小结
第6章 结论与展望
6.1 总结
6.2 展望
参考文献
作者简介
致谢
本文编号:3813089
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3813089.html
最近更新
教材专著