当前位置:主页 > 医学论文 > 肿瘤论文 >

肿瘤基因表达谱的数据挖掘与识别分类

发布时间:2019-09-06 08:28
【摘要】:肿瘤种类繁多,其致病机理复杂,是危及人类身体健康的主要恶性疾病之一,尽早确诊对患者的治疗至关重要。基因芯片技术是功能基因组学的一个突破,它所产生的基因表达谱数据极大的推进了功能基因组学的发展。基于基因表达谱的数据挖掘,可以让我们更好地认识肿瘤,从分子生物学角度去探索其发生机理,对肿瘤诊断、治疗以及新药物的研制都具有积极的意义。由于基因表达谱数据具有维度高、样本小、高冗余以及高噪声等特点,本课题采用时频分析工具从三个角度研究了肿瘤基因表达谱数据的特征提取。本课题提出了利用小波包变换对基因表达谱进行分解,进而提取相应各频带的样本熵值构成特征向量。然后本课题针对基因表达谱数据的高噪声特性,提出对肿瘤基因表达谱数据进行EMD分解,计算出相应各IMF与原始数据的相关系数,保留相关系数较大的IMF分量并重构数据,进而筛选获得特征向量。此外,利用基因表达谱数据在分数阶傅里叶变换最优阶次上的全局特性,筛选分数阶傅里叶系数幅值的熵权较大的位置的分数阶傅里叶系数作为特征向量。最后针对分别来自美国MIT大学和普林斯顿大学数据库的急性白血病、结肠癌等基因表达谱数据集进行了仿真验证,分类结果正确率都达到了90%以上。
【图文】:

流程图,基因芯片,流程图,微阵列


北京理工大学硕士学位论文的基因表情况。所谓基因表达就是 DNA 到 mRNA 再到蛋白的过程,其中基因表达水平常常通过该基因所转录的 mRNA 的数量来衡量。在基因芯片实验中,,先选择不同状态的样本,并将其分为实验样本和参考样本。在其 mRNA 转录过程分别用红、绿荧光基团进行标记并混合,再与微阵列的探针序列进行杂交等步骤获得微阵列上每个点的红光强度和绿光强度(Cy5 和 Cy3),那么基因在实验样本中的表达水平就是其比值。图 1.1展示了基因芯片从制备到实验获取基因表达谱数据的全过程[21]。

示意图,小波包分解,示意图,分解滤波器


从小波包库中选择能构成 2L R 空间的一个基函数系称为 任意固定的 j 值, / 22 2 , , ,j jn n t t k j k Z n Z 均可构成个正交基与短时傅立叶基类似,称为子带基。一个正交小波来构造小波包时,那么与所选择的小波所对应的,kg 分别是低通分解滤波器以及高通分解滤波器被 2 除后的重函数序列 ( 0,1,2,...)nW t n : 2 1202 2Nn k nkW t h W t k 2 12 102 2Nn k nkW t g W t k 0W t t是尺度函数; 1W t t是小波函数。包对信号的分解特性变换不仅对低频部分进行分解,而且还对高频部分进行分解方法。图 3.1 为信号的小波包分解示意图。
【学位授予单位】:北京理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13;R730.2

【参考文献】

相关期刊论文 前6条

1 应凤祥,杨式升,张敏,李豫喜,周宏燕;激光扫描共聚焦显微镜研究储层孔隙结构[J];沉积学报;2002年01期

2 李颖新,阮晓钢;基于支持向量机的肿瘤分类特征基因选取[J];计算机研究与发展;2005年10期

3 庞广昌,陶|

本文编号:2532509


资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/zlx/2532509.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e9a9f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com