遗传聚类算法的改进及其在基因表达数据分析中的应用
发布时间:2021-10-08 02:17
近年来,cDNA微阵列技术的出现和应用,使得基因表达数据被大量检测出来,从而为人类在分子层级分析疾病提供了充足的样本数据。而如何通过海量的基因表达数据挖掘出有用的信息,便成了当前的研究热点。聚类算法作为数据挖掘中的重要算法,是对基因表达数据分析的一个有效手段,科研人员常利用聚类算法找出相似基因,从而利用已知的基因表达数据分析出样本的显著性特点。在众多聚类算法中,k-means作为最常用的聚类算法之一,常用在基因表达数据的分析中。但k-means本身具有初始中心点敏感,局部收敛等问题,遗传算法作为求解多目标优化问题的一个常用手段,可以有效地提升k-means的聚类效果。本文研究并编码实现了遗传聚类(遗传k-means算法、遗传k-meanS++算法);为了提升遗传聚类算法的收敛速度和种群多样性对遗传聚类算法进行了改进,并用实验验证了改进算法的有效性,进一步将该算法运用于基因表达数据分析领域。具体改进之处如下:(1)初始种群的选择,在遗传聚类算法中,一个进化个体代表着一种聚类中心点的分布方案,此时的初始种群相当于k-means聚类中的初始中心点集合。而在基因表达数据中存在着大量的无关基因,...
【文章来源】:安徽大学安徽省 211工程院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图1-1.DNA中心法则??Fig?1?-1.?DNA?center?rule??
个人不同时期之间的差别,这也是个体间差异性的主要原因。??基因将DNA序列中的遗传信息转换为蛋白质的过程,称为基因表达。基因??表达的过程遵循DNA中心法则,如图1-1所示。由DNA中心法则可知,基因??无法直接合成蛋白质,而是先通过基因转录将DNA转录为mRNA,接着通过基??因翻译,将mRNA翻译成相关的蛋白质。??^ ̄^?u?.1—1?翮译—??DNA?_? ̄n?mRNA???蛋白质??逆转策??图1-1.DNA中心法则??Fig?1?-1.?DNA?center?rule??在整个基因表达过程中,DNA需要通过转录转化为mRNA,再由mRNA翻??译成相应的蛋白质,从而产生不同个体的生物性状。这里mRNA起到了信息传??递的作用,也间接体现了各个基因的活跃程度。因此,我们可以通过测量mRNA??的转录丰度来作为基因的表达水平。??1??
图2-3.遗传算法的基本流程??Fig2-3.?Flow?chart?of?genetic??由图2-3可知,遗传算法在求解多目标优化问题过程中,求解种群需要经过??选择、交叉、变异等进化算子才能逐步逼近最优解,而在进化过程中,每一过程??的介绍如下所示。??(1)
【参考文献】:
期刊论文
[1]基于时序加权PPI网络的关键蛋白质识别[J]. 胡健,朱海湾,毛伊敏. 计算机工程与应用. 2019(23)
[2]C4玉米中光呼吸铵转运蛋白候选基因的确定[J]. 李享,孙宁,刘征. 分子植物育种. 2019(23)
[3]精英遗传K-medoids聚类算法[J]. 宋飞豹,贾瑞玉. 计算机工程与应用. 2018(22)
[4]一种MapReduce架构下基于遗传算法的K-Medoids聚类[J]. 赖向阳,宫秀军,韩来明. 计算机科学. 2017(03)
[5]局部子空间聚类[J]. 刘展杰,陈晓云. 自动化学报. 2016(08)
[6]基于强类别特征近邻传播的半监督文本聚类[J]. 文翰,肖南峰. 模式识别与人工智能. 2014(07)
[7]基于MapReduce的基因数据密度层次聚类算法[J]. 涂金金,杨明,郭丽娜. 中国科学技术大学学报. 2014(07)
[8]一种改进的谱聚类算法及其在基因表达谱分析中的应用[J]. 葛芳,王年,郭秀丽. 安徽大学学报(自然科学版). 2012(05)
[9]双精英协同进化遗传算法[J]. 刘全,王晓燕,傅启明,张永刚,章晓芳. 软件学报. 2012(04)
[10]一种基于动态遗传算法的聚类新方法[J]. 何宏,谭永红. 电子学报. 2012(02)
博士论文
[1]数据挖掘在癌症细胞增殖机制分析中的应用研究[D]. 孙慧妍.吉林大学 2018
[2]基因表达数据的相似性度量和特征提取研究[D]. 王文俊.西安电子科技大学 2011
硕士论文
[1]基于基因表达数据的癌症共性分析方法研究[D]. 胡心颖.中国科学技术大学 2018
[2]一种新的混合遗传的基因聚类方法[D]. 王化楠.大连理工大学 2014
本文编号:3423236
【文章来源】:安徽大学安徽省 211工程院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图1-1.DNA中心法则??Fig?1?-1.?DNA?center?rule??
个人不同时期之间的差别,这也是个体间差异性的主要原因。??基因将DNA序列中的遗传信息转换为蛋白质的过程,称为基因表达。基因??表达的过程遵循DNA中心法则,如图1-1所示。由DNA中心法则可知,基因??无法直接合成蛋白质,而是先通过基因转录将DNA转录为mRNA,接着通过基??因翻译,将mRNA翻译成相关的蛋白质。??^ ̄^?u?.1—1?翮译—??DNA?_? ̄n?mRNA???蛋白质??逆转策??图1-1.DNA中心法则??Fig?1?-1.?DNA?center?rule??在整个基因表达过程中,DNA需要通过转录转化为mRNA,再由mRNA翻??译成相应的蛋白质,从而产生不同个体的生物性状。这里mRNA起到了信息传??递的作用,也间接体现了各个基因的活跃程度。因此,我们可以通过测量mRNA??的转录丰度来作为基因的表达水平。??1??
图2-3.遗传算法的基本流程??Fig2-3.?Flow?chart?of?genetic??由图2-3可知,遗传算法在求解多目标优化问题过程中,求解种群需要经过??选择、交叉、变异等进化算子才能逐步逼近最优解,而在进化过程中,每一过程??的介绍如下所示。??(1)
【参考文献】:
期刊论文
[1]基于时序加权PPI网络的关键蛋白质识别[J]. 胡健,朱海湾,毛伊敏. 计算机工程与应用. 2019(23)
[2]C4玉米中光呼吸铵转运蛋白候选基因的确定[J]. 李享,孙宁,刘征. 分子植物育种. 2019(23)
[3]精英遗传K-medoids聚类算法[J]. 宋飞豹,贾瑞玉. 计算机工程与应用. 2018(22)
[4]一种MapReduce架构下基于遗传算法的K-Medoids聚类[J]. 赖向阳,宫秀军,韩来明. 计算机科学. 2017(03)
[5]局部子空间聚类[J]. 刘展杰,陈晓云. 自动化学报. 2016(08)
[6]基于强类别特征近邻传播的半监督文本聚类[J]. 文翰,肖南峰. 模式识别与人工智能. 2014(07)
[7]基于MapReduce的基因数据密度层次聚类算法[J]. 涂金金,杨明,郭丽娜. 中国科学技术大学学报. 2014(07)
[8]一种改进的谱聚类算法及其在基因表达谱分析中的应用[J]. 葛芳,王年,郭秀丽. 安徽大学学报(自然科学版). 2012(05)
[9]双精英协同进化遗传算法[J]. 刘全,王晓燕,傅启明,张永刚,章晓芳. 软件学报. 2012(04)
[10]一种基于动态遗传算法的聚类新方法[J]. 何宏,谭永红. 电子学报. 2012(02)
博士论文
[1]数据挖掘在癌症细胞增殖机制分析中的应用研究[D]. 孙慧妍.吉林大学 2018
[2]基因表达数据的相似性度量和特征提取研究[D]. 王文俊.西安电子科技大学 2011
硕士论文
[1]基于基因表达数据的癌症共性分析方法研究[D]. 胡心颖.中国科学技术大学 2018
[2]一种新的混合遗传的基因聚类方法[D]. 王化楠.大连理工大学 2014
本文编号:3423236
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3423236.html
最近更新
教材专著