当前位置:主页 > 科技论文 > 软件论文 >

基于数据挖掘的基因和疾病的关系研究

发布时间:2022-12-11 04:16
  利用先进的数据挖掘方法分析研究基因和疾病之间的关系有助于发现疾病的发生机制,从而为疾病的诊断和个性化治疗提供科学依据。但是,基因相关信息的数据通常具有高维小样本、高噪声、高冗余的特点,这使得很多优秀的数据挖掘和机器学习方法在处理分析基因与疾病相关数据时效果较差。因此,需要针对具体基因和疾病的相关数据的特点,设计合适的算法模型来进行数据分析。在本论文中,针对不同基因与疾病相关数据的特点,从基因功能预测,特征基因选择和miRNA和疾病的关系三个方面对基因与疾病的关系进行了分析研究。提出了一系列相应的数据挖掘方法对其进行处理。本文的主要研究内容和创新点如下:1)基因功能预测问题事实上是一个多示例多标签问题,在本文中使用机器学习的方法对基于多示例多标签对象进行探讨,旨在对未知的基因功能进行注释。本文将层次聚类与多标签学习框架相结合,并提出一个基于基因本体层次结构的多标签层次聚类算法框架。本文将多示例多标签的问题转化为相对简单的单示例多标签问题。这个算法依据的是基因表达之间的相关性,并依据基因之间的功能类的最大化相关性对相应的聚类方法进行补充,并构建有相似基因功能的基因为多示例数据集。最后,对提... 

【文章页数】:120 页

【学位级别】:博士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 基因功能预测研究现状
        1.2.2 特征基因选择研究现状
        1.2.3 miRNA与疾病的关系研究现状
    1.3 本文研究目的及主要工作
    1.4 论文的组织结构
第2章 相关工作
    2.1 基因功能注释数据库介绍
        2.1.1 KEGG数据库
        2.1.2 GO数据库
    2.2 基因表达谱数据
        2.2.1 基因表达谱的获取及数据表示
        2.2.2 基因表达谱相关数据特点
        2.2.3 常用基因表达谱相关数据库
    2.3 miRNAs与疾病相关数据
    2.4 特征选择方法
        2.4.1 包装方法
        2.4.2 过滤方法
        2.4.3 嵌入式方法
        2.4.4 集成方法
        2.4.5 混合方法
        2.4.6 特征选择方法之间的比较
    2.5 矩阵完成方法
    2.6 小结
第3章 基于本体层次结构的基因功能预测
    3.1 引言
        3.1.1 基因功能预测任务
    3.2 多示例多标签学习
        3.2.1 MLL算法
    3.3 基于本体层次的多示例方法
        3.3.1 基因本体论层次结构
        3.3.2 GOMIHC算法
    3.4实验
        3.4.1 数据集
        3.4.2 性能评价指标
    3.5 实验结果和分析
        3.5.1 实验设计
        3.5.2 实验结果
        3.5.3 实验结果分析
    3.6 小结
第4章 基于最大局部判别边缘的半监督的基因选择
    4.1 引言
    4.2 特征选择的半监督最大判别信息
        4.2.1 SMLM
        4.2.2 SMLM的算法流程
    4.3 实验及结果分析
        4.3.1 实验数据
        4.3.2 对比算法介绍
        4.3.3 参数设置及评价指标
        4.3.4 实验结果与分析
    4.4 小结
第5章 基于诱导矩阵完成预测MIRNA-疾病关联
    5.1 引言
    5.2 数据预处理
    5.3 相似性度量方法
        5.3.1 疾病语义相似性
        5.3.2 计算miRNA功能相似性
        5.3.3 计算疾病和miRNA的高斯核相似性
        5.3.4 整合疾病和miRNA的相似性
    5.4 基于诱导矩阵完成预测miRNA-疾病关联
        5.4.1 方法概述
        5.4.2 构建miRNA疾病双层网络
        5.4.3 诱导矩阵完成算法
    5.5 结果与讨论
        5.5.1 性能评估指标
        5.5.2 结果分析
        5.5.3 对新疾病的性能研究
        5.5.4 评估不同数据源的贡献
        5.5.5 案例研究
    5.6 小结
结论
参考文献
致谢
附录A 攻读学位期间所发表的学术论文
附录B 攻读博士学位期间主要参与的课题


【参考文献】:
期刊论文
[1]机器学习方法在基因功能注释中的应用[J]. 李金城,廖奇,沈其君.  中国生物化学与分子生物学报. 2016(05)
[2]基因表达谱数据分析技术[J]. 刘玲.  电脑与信息技术. 2010(06)
[3]基因 在疾病中扮演的角色[J]. 孙卫华.  医药保健杂志. 2009(20)
[4]无监督环境下基于聚类集成的特征选择[J]. 罗毅辉,熊曙初,王四春,范强.  微计算机信息. 2008(09)
[5]基因功能注释——后基因组时代面临的挑战[J]. 王行国.  世界科技研究与发展. 2007(01)
[6]基因功能注释的计算方法[J]. 朱新宇.  生物技术. 2003(06)

博士论文
[1]疾病相关的miRNAs与lncRNAs预测方法研究[D]. 谷长龙.湖南大学 2017

硕士论文
[1]基于半监督和无监督学习的特征选择算法研究[D]. 郑欣.西北大学 2017
[2]半监督特征选择和特征选择的稳定性研究[D]. 陈东.上海交通大学 2013
[3]基于改进K-means聚类的系统发育谱方法在基因功能注释中的应用[D]. 孙平平.东北师范大学 2008



本文编号:3718123

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3718123.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a50d1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com