当前位置:主页 > 医学论文 > 肿瘤论文 >

癌症基因表达数据属性偏序表示与知识发现

发布时间:2017-09-18 02:24

  本文关键词:癌症基因表达数据属性偏序表示与知识发现


  更多相关文章: 属性偏序结构图 肺腺癌基因表达数据 特征选择 数据离散化 知识发现


【摘要】:基因芯片技术可以在一次实验中大规模并行检测成千上万个基因的表达量,对癌症等疾病的分类、诊断研究有非常重要的实际意义。近几年来基因表达数据量呈指数式的增长,如何有效的组织分析、处理这些海量的基因表达数据,从中提取出有效的生物、医学信息已成为人们关注和研究的热点。针对这一问题,本文将特征选择方法与以形式概念分析为基础的属性偏序结构图相结合来处理肺腺癌基因表达数据,探索研究一种新的知识发现方法。本文研究了形式概念分析和属性偏序结构图的基础概念与相关定义,分析了属性偏序结构图用于知识发现和可视化数据关系方面所具有的优势,并提出了一个将特征选择与属性偏序图相结合应用于癌症基因表达数据方面的知识发现方案;之后介绍了基因表达数据方面相关内容和所要处理的肺腺癌基因表达数据来源及对其所做的预处理过程;接着结合使用T-test方法和Elastic net方法对肺腺癌基因表达数据进行了特征基因选择,共选出35个特征基因,该过程大大降低了数据的维度。最后,运用c#编程对数据进行离散化处理生成二值的形式背景,进而生成属性偏序结构图,根据图中的簇集分布及层次关系进行知识发现。最终发现,选择出的特征基因在肺腺癌肿瘤样本和正常样本中均差异表达,识别出了与肿瘤发生和转移密切相关的靶基因,而且在对比分析过程中发现吸烟影响部分基因在肿瘤样本中的表达;另外,大部分的特征基因在肿瘤样本中表达值一般,只有少数基因是高表达和低表达的。
【关键词】:属性偏序结构图 肺腺癌基因表达数据 特征选择 数据离散化 知识发现
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13;R730
【目录】:
  • 摘要5-6
  • Abstract6-8
  • 目录8-10
  • 第1章 绪论10-15
  • 1.1 研究背景与意义10-12
  • 1.2 国内外研究现状12-13
  • 1.3 本文主要内容13-15
  • 第2章 形式概念分析理论15-30
  • 2.1 序与格15-17
  • 2.2 形式背景与形式概念17-19
  • 2.3 形式背景的生成19-21
  • 2.4 属性偏序结构图21-29
  • 2.4.1 基本的属性定义22-28
  • 2.4.2 生成属性偏序图的规则28-29
  • 2.5 本章小结29-30
  • 第3章 基因表达数据及预处理30-41
  • 3.1 生物信息学30-31
  • 3.2 基因芯片技术原理及应用31-32
  • 3.3 微阵列基因表达数据32-36
  • 3.4 本文研究所用数据集及预处理36-40
  • 3.5 本章小结40-41
  • 第4章 特征基因的选择41-51
  • 4.1 特征选择简述41-42
  • 4.2 Lasso算法介绍42-44
  • 4.2.1 Lasso算法43
  • 4.2.2 Lars算法43-44
  • 4.3 Lasso相关方法44-46
  • 4.3.1 Elastic Net44-45
  • 4.3.2 Adaptive Lasso45-46
  • 4.4 肺癌基因表达数据特征基因选择46-50
  • 4.4.1 T-test对特征基因的初步选择46-48
  • 4.4.2 Elastic net对特征基因的选择48-50
  • 4.5 本章小结50-51
  • 第5章 肺癌基因数据的知识发现51-66
  • 5.1 生成形式背景51-52
  • 5.2 样本为对象特征基因为属性的偏序结构知识发现52-58
  • 5.3 特征基因作为属性的对比知识发现58-63
  • 5.3.1 不吸烟患者的组织样本为对象58-60
  • 5.3.2 吸烟患者的组织样本为对象60-62
  • 5.3.3 对比分析62-63
  • 5.4 特征基因作为对象的知识发现63-65
  • 5.5 本章小结65-66
  • 结论66-68
  • 参考文献68-72
  • 攻读硕士学位期间承担的科研任务与主要成果72-73
  • 致谢73-74
  • 作者简介74

【参考文献】

中国期刊全文数据库 前2条

1 张靖;胡学钢;张玉红;施万锋;;K-split Lasso:有效的肿瘤特征基因选择方法[J];计算机科学与探索;2012年12期

2 孙中吉;李樱;;生物信息学在医学基础研究中的应用[J];医学信息学杂志;2013年11期

中国博士学位论文全文数据库 前1条

1 桑雨;连续数据离散化方法研究[D];大连理工大学;2012年

中国硕士学位论文全文数据库 前1条

1 孙良刚;基于属性偏序原理的属性偏序结构图表示算法研究[D];燕山大学;2012年



本文编号:872842

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/zlx/872842.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户14f68***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com