基于数据融合的疾病基因挖掘算法研究

发布时间:2021-12-22 17:12
  基于基因表达数据,从海量基因中选择疾病相关基因对理解疾病的发生发展、促进疾病诊断和治疗具有重要意义。目前大多研究工作基于基因表达差异寻找疾病基因,难以发现差异表达较小的疾病相关基因,而通过差异网络获得的功能数据能够较好地体现基因在单个样本中的功能变化水平,发现非差异表达的疾病相关基因。为了充分搜索到疾病相关基因,本文将分别基于平衡及不平衡的基因表达数据,设计融合基因表达数据和功能数据的疾病基因选择方法。该方法既能够挖掘表达差异大的基因,又能够发现表达差异较小但功能发生改变的基因。本文的主要研究工作如下:(1)本文提出了融合基因表达数据和功能数据的疾病基因挖掘算法(GFDGM)。传统基于基因表达数据的差异分析方法难以选择表达差异小但功能上与疾病相关的基因。针对该问题,本文提出一种融合基因表达数据和功能数据的疾病基因挖掘算法。首先,利用样本特异网络方法构建反映基因功能变化的差异网络。其次,基于差异网络量化每个基因在功能变化上的程度,即功能数据,再融合基因表达数据和功能数据。最后,为了使融合数据基因间冗余程度小、关联程度大,基于互信息设计了一种非支配排序基因选择方法挖掘疾病相关基因。实验结果... 

【文章来源】:安徽大学安徽省 211工程院校

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 基于基因表达数据的疾病基因选择
        1.2.2 基于不平衡基因表达数据的疾病基因选择
        1.2.3 数据融合方法的研究现状
    1.3 本文的工作与安排
第二章 相关理论及算法
    2.1 基因表达数据相关理论
        2.1.1 基因表达数据
        2.1.2 基于基因表达数据的基因网络
    2.2 不平衡基因表达数据相关理论
        2.2.1 不平衡基因表达数据概述
        2.2.2 不平衡基因表达数据性能评估
    2.3 疾病相关基因选择方法
        2.3.1 特征选择算法理论
        2.3.2 差异表达分析方法
        2.3.3 通路分析方法
    2.4 多目标进化优化算法相关理论
    2.5 本章小结
第三章 融合基因表达数据和功能数据的疾病基因挖掘算法
    3.1 算法思想
    3.2 数据融合方法和算法流程
        3.2.1 构建差异网络
        3.2.2 融合数据
        3.2.3 基因选择
        3.2.4 算法流程
    3.3 实验
        3.3.1 数据集描述
        3.3.2 实验算法描述
        3.3.3 参数设置
        3.3.4 分类准确率
        3.3.5 样本类型分布
        3.3.6 疾病相关基因
    3.4 本章小节
第四章 融合不平衡数据的疾病基因挖掘算法
    4.1 算法思想
    4.2 算法流程
        4.2.1 IFDGS的数据融合策略
        4.2.2 IFDGS初始化策略
        4.2.3 IFDGS交叉算子
        4.2.4 IFDGS变异算子
        4.2.5 IFDGS评价函数和目标函数
        4.2.6 IFDGS算法流程
    4.3 实验与分析
        4.3.1 实验设置
        4.3.2 实验结果分析
        4.3.3 融合数据有效性分析
        4.3.4 初始化和交叉变异算子有效性分析
    4.4 本章小结
结论
    工作总结
    未来展望
参考文献
攻读硕士学位期间发表的学术成果
攻读硕士学位期间参与的科研项目
致谢


【参考文献】:
期刊论文
[1]高维小样本分类问题中特征选择研究综述[J]. 王翔,胡学钢.  计算机应用. 2017(09)
[2]A Feature Selection Method for Prediction Essential Protein[J]. Jiancheng Zhong,Jianxin Wang,Wei Peng,Zhen Zhang,Min Li.  Tsinghua Science and Technology. 2015(05)
[3]分子诊断在癌症早期诊断中的研究现状及展望[J]. 樊江平,钟理,董晓民,薛雯,罗杰.  中国实验诊断学. 2012(10)
[4]基因表达谱芯片的数据分析[J]. 吴斌,沈自尹.  世界华人消化杂志. 2006(01)

硕士论文
[1]微阵列基因表达数据混合特征算法研究[D]. 董文娟.沈阳工业大学 2017
[2]基因表达谱的肿瘤特征基因提取研究分析[D]. 尹蕾.西安建筑科技大学 2014



本文编号:3546768

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3546768.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户26888***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com