面向多类别肿瘤分类的基因选择算法研究
发布时间:2024-03-25 04:26
癌症已成为威胁人类生命健康最重要的疾病之一。肿瘤诊断是医学领域的一大难题。DNA微阵列技术的出现使得肿瘤在基因表达水平上的研究得以实现,这为肿瘤分类提供了另外一种重要手段。然而基因表达数据集包含了大量与肿瘤分类不相关的基因和冗余,如果不进行基因选择,即使借用最好的分类器也无法获得准确的分类结果。基因选择不但可以提升肿瘤的分类精度,降低基因个数,还有助于发现疾病机制,降低诊断成本。本文将根据基因表达数据的特点,对基因选择算法进行深入研究,主要内容如下:(1)提出一种面向基因选择的结合信息增益和支持向量机的自适应粒子群优化算法(IG-SVM-APSO)。首先利用信息增益对基因进行初步过滤,排除掉大量无关基因和噪声。针对粒子群优化算法容易陷入局部最优、过早收敛的问题,引入自适应惯性权重来增强粒子群优化算法的全局搜索能力。然后,以SVM为适应度函数,使用自适应粒子群优化算法对基因进行选择。实验表明,IG-SVM-APSO拥有较高的分类精度和较少的基因选择个数。(2)信息增益虽然很好的利用了类别信息,但没有考虑到特征间的相互信息。为了降低基因间的冗余,选出相似性较小的基因,提出了一种结合信息增益...
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
本文编号:3938538
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图4.1混合过滤算法IG&PCC示意图
中国计量大学硕士学位论文21基因将被分为两组。对于基因i,它与其余基因间的相互信息值定义如下:=∑||=11,≠(41)上式中,表示基因的原始维度。从上式中可以看出,当值较小时,表明基因i和其余基因间的相关性较小,显得比较独特;当值较大时,表明基因i和其余基因较相似,即相关性较大....
图4.2粒子结构示意图
中国计量大学硕士学位论文22的基因选择过程如图4.1所示,标记D和标记S分别表示属于组和组的基因。4.2引入局部搜索的改进简化群优化算法尽管SSO是一种比较高效的启发式搜索算法,但仍然存在着一些缺点,比如由于选择相似基因引起的冗余,缺乏对基因选择个数的关注等。为克服这些缺点,提高....
本文编号:3938538
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3938538.html
最近更新
教材专著