EMD去噪算法研究及其在结肠癌基因表达数据集中的应用
发布时间:2017-11-13 17:04
本文关键词:EMD去噪算法研究及其在结肠癌基因表达数据集中的应用
更多相关文章: 基因表达数据集 经验模态分解 阈值去噪 噪声标准差 fGn模型
【摘要】:目前对基因表达数据集的研究是生物信息领域中的热点之一,由于生物机体外部某些疾病的发生可能与内部基因的表达存在某种关联,因此可以通过分析与疾病有关的基因表达数据集,找寻可能引发疾病的关键基因,探究疾病的发病机理,从而为疾病的预防与控制开辟一条新的途径。然而数据集的制备过程比较复杂,制备过程中很容易受到系统或人为干扰,干扰会成为影响基因数据正常表达的噪声成分,其将不利于数据集做进一步的分析与处理。若想提高数据后期分析的准确性就要保证原始基因数据的真实性,因此对基因表达数据集进行去噪具有重要的现实意义。本文去噪研究的理论基础是经验模态分解(Empirical Mode Decomposition, EMD),其最大的优势在于信号可以自适应分解,因此本文将以EMD为基础对去噪方法展开研究并将其应用到基因表达数据集去噪分析中。基于阈值的EMD去噪方法不仅原理简单,而且算法设计灵活,通过对现有EMD阈值去噪方法进行分析与总结可知,本征模态函数(Intrinsic Mode Function,IMF)分量分界点选择和阈值中噪声标准差计算是两个关键环节,其算法设计将影响到信号最终的去噪效果。传统中值估计EMD去噪利用信号自相关函数的特点判断IMF分量的分界点较为方便合理,但是使用中值估计IMF分量噪声标准差的方法不具有针对性,计算结果的准确性较难保证,最终影响信号去噪效果。相比之下,基于白噪声EMD分解特性的噪声标准差计算可以较好的反映白噪声在EMD分解下随IMF分量的分布特性,是计算IMF噪声标准差的一种新方法,因此本文将以中值估计EMD去噪为基础联合新的噪声标准差计算从而优化中值估计EMD去噪。优化后的方案一方面保留了传统EMD去噪中IMF分界点选择的优势,另一方面提升了IMF分量噪声标准差计算的准确性,从而改善信号去噪的效果。上述优化后的EMD去噪方法对白噪声的降噪具有较好的效果,但是该方法对其他种类噪声的降噪效果还有待进一步提升,针对上述不足,本文使用分数阶高斯噪声(fractional Gaussian noise,fGn)模型下的噪声标准差计算方法并对其做了相应的改进从而应用到EMD去噪中,作为中值估计EMD去噪的另一种优化方案。fGn模型下IMF分量噪声标准差计算方法可以反映各个IMF分量间噪声标准差的关系,改进后的计算方式可进一步增强本文去噪的针对性,同时由于fGn是离散高斯白噪声的一种广义化模型,因此在该模型下去噪不仅可以减少常见的白噪声而且可以降低有色噪声的干扰,进而增强去噪效果。本文的优化去噪方案都将通过仿真信号及结肠癌基因表达数据集去噪实验进行测试验证,结果显示,本文方案在信号降噪的同时能够保留更多的有用信息,去噪效果整体优于中值估计EMD去噪,与此同时也为结肠癌基因表达数据集的去噪提供了一种可参考的方案。
【学位授予单位】:陕西师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R735.35;TN911.4;Q811.4
【参考文献】
中国硕士学位论文全文数据库 前1条
1 陈佳妮;基因表达数据分析中IGA-FCM聚类算法研究与实现[D];东北林业大学;2010年
,本文编号:1181571
本文链接:https://www.wllwen.com/yixuelunwen/swyx/1181571.html