基于Boosting的基因表达数据分类
发布时间:2021-12-22 03:29
基因表达水平可以通过DNA微阵列技术进行测量,由此产生了基因表达数据。通过分析研究基因表达数据可以挖掘有效信息,有助于病理分析与疾病诊断,利用基因表达数据进行癌症分类诊断是一种重要的癌症检测方法。但由于基因表达数据具有维数高、样本少的特点,使得传统的模式识别方法容易陷入“维数灾难”。Boosting是一种集成学习算法,它可以将任意分类算法作为基分类算法进行集成,进而提高基分类算法的分类正确率。堆栈自动编码器是一种深度学习方法,它通过大量训练样本可以学习到数据中的高层次特征,使其在诸多模式识别问题上具有良好的分类性能。由于基因表达数据样本数较少,使用深度学习方法对基因表达数据分类易出现分类精度不高的问题。Boosting是一种迭代算法,每轮学习使用的训练样本都不同,可以一定程度上弥补样本数不足的问题。因此本文提出一种基于堆栈自动编码器与Boosting相结合的方法对基因表达数据分类,本算法首先采用主成分分析对基因表达数据降维,然后将堆栈自动编码器作为Boosting的基分类算法进行学习训练,最后组合多个堆栈自动编码器进行决策。通过在9组真实基因表达数据上实验发现本算法将堆栈自动编码器的分...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
cDNA微阵列获取基因表达数据过程示意图
图 4. 1 决策树实例类过程从测试颜色开始,判定颜色,如喜欢”,如果为黑色,则继续判断价格如果价格判定为实惠,则样本分类为“一个递归算法,在每一步对特征进行测拆分将数据集划分为子集,子集构成的定,直到叶子节点,即可得到待测样本。an 提出的一种决策树算法实现方法,ID增益作为评价标准,进而实现对数据归,选取信息增益最大的属性进行分裂。大,信息越不确定。 logcEntropy S p p
本文编号:3545674
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
cDNA微阵列获取基因表达数据过程示意图
图 4. 1 决策树实例类过程从测试颜色开始,判定颜色,如喜欢”,如果为黑色,则继续判断价格如果价格判定为实惠,则样本分类为“一个递归算法,在每一步对特征进行测拆分将数据集划分为子集,子集构成的定,直到叶子节点,即可得到待测样本。an 提出的一种决策树算法实现方法,ID增益作为评价标准,进而实现对数据归,选取信息增益最大的属性进行分裂。大,信息越不确定。 logcEntropy S p p
本文编号:3545674
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3545674.html
最近更新
教材专著