肿瘤基因特征选择方法研究
发布时间:2020-12-04 15:21
从肿瘤基因表达谱中分析和挖掘出样本的分类特征,对揭示癌症产生和病变过程具有重要的生物学意义。基因表达谱数据中包含组织细胞中所有可测基因的表达水平,但事实是仅有少量基因才切实与样本类别有关。为此,针对高维、小样本的基因表达谱数据,探索泛化能力更强,更好描述基因表达谱数据的特征选择模型,从成千上万个基因中选出对样本分类有效的特征基因,对肿瘤的分型及临床医疗具有重大的探究意义和实用价值。针对当前特征基因选择算法普遍存在训练时间长和分类精度偏低等不足,本文设计了高效的特征基因选择与分类的相关算法,选择较少的特征基因,且保持甚至提高相关模型的分类精度。主要研究内容包括:(1)针对邻域粗糙集采用全局邻域求解近似,存在计算时间复杂度高且很难对基因表达谱数据精确描述等问题,构建了基于主成分分析和改进邻域粗糙集算法的PNRS模型。首先采用主成分分析算法获得低维的特征基因空间;然后利用改进的邻域粗糙集算法进行特征基因选择,即采用欧氏距离计算每列属性邻域值,选取所有属性邻域集合计算邻域决策系统的近似;最后利用启发式搜索算法选择特征基因子集。实验结果表明,该方法能有效剔除无关噪声且获得较高的正确识别率。(2)...
【文章来源】:河南师范大学河南省
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
000年至2011年中国癌症患病率和致死率的趋势图
从DNA微阵列获取基因表达数据的一般过程
图 1-2 从 DNA 微阵列获取基因表达数据的一般过程表达谱数据从数学计算角度来说是 n×m 矩阵。g1,i, g2,i, …, gn,i表示第 ,gj,1, gj,2, …, gj,m表示 1, 2, …, m 个基因,gi, j表示对应的基因表达水平样本的类标签[7]。基因表达谱数据的数学表示见图 1-3。
【参考文献】:
期刊论文
[1]基于PCA和多邻域粗糙集的肿瘤特征基因选择算法[J]. 徐久成,穆辉宇,冯森. 郑州大学学报(理学版). 2017(04)
[2]基于对称不确定性和SVM递归特征消除的信息基因选择方法[J]. 叶明全,高凌云,伍长荣,万春圆. 模式识别与人工智能. 2017(05)
[3]一种基于改进的遗传算法的癌症特征基因选择方法[J]. 范方云,孙俊,王梦梅. 江南大学学报(自然科学版). 2015(04)
[4]二阶矩阵的特征值和特征向量常考题型例析[J]. 魏佐忠. 数学通讯. 2014(Z2)
[5]基于边界判别投影的数据降维[J]. 何进荣,丁立新,李照奎,胡庆辉. 软件学报. 2014(04)
[6]基于迭代Lasso的肿瘤分类信息基因选择方法研究[J]. 张靖,胡学钢,李培培,张玉红. 模式识别与人工智能. 2014(01)
[7]基于核空间距离测度的特征选择[J]. 蔡哲元,余建国,李先鹏,金震东. 模式识别与人工智能. 2010(02)
[8]利用协同分类方法识别癌症类型[J]. 卢新国,陈东,杜家宜,周娟. 计算机科学. 2010(02)
[9]基于邻域粒化和粗糙逼近的数值属性约简[J]. 胡清华,于达仁,谢宗霞. 软件学报. 2008(03)
[10]生物信息学中基因芯片的特征选择技术综述[J]. 周昉,何洁月. 计算机科学. 2007(12)
硕士论文
[1]基于监督学习的肿瘤特征基因选择方法研究[D]. 李涛.河南师范大学 2016
[2]肿瘤基因表达谱的数据挖掘与识别分类[D]. 郭志鹏.北京理工大学 2015
[3]基因表达数据的谱聚类方法研究[D]. 陈方.湖南大学 2015
[4]基于邻域互信息的特征基因选择方法研究[D]. 徐天贺.河南师范大学 2014
本文编号:2897830
【文章来源】:河南师范大学河南省
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
000年至2011年中国癌症患病率和致死率的趋势图
从DNA微阵列获取基因表达数据的一般过程
图 1-2 从 DNA 微阵列获取基因表达数据的一般过程表达谱数据从数学计算角度来说是 n×m 矩阵。g1,i, g2,i, …, gn,i表示第 ,gj,1, gj,2, …, gj,m表示 1, 2, …, m 个基因,gi, j表示对应的基因表达水平样本的类标签[7]。基因表达谱数据的数学表示见图 1-3。
【参考文献】:
期刊论文
[1]基于PCA和多邻域粗糙集的肿瘤特征基因选择算法[J]. 徐久成,穆辉宇,冯森. 郑州大学学报(理学版). 2017(04)
[2]基于对称不确定性和SVM递归特征消除的信息基因选择方法[J]. 叶明全,高凌云,伍长荣,万春圆. 模式识别与人工智能. 2017(05)
[3]一种基于改进的遗传算法的癌症特征基因选择方法[J]. 范方云,孙俊,王梦梅. 江南大学学报(自然科学版). 2015(04)
[4]二阶矩阵的特征值和特征向量常考题型例析[J]. 魏佐忠. 数学通讯. 2014(Z2)
[5]基于边界判别投影的数据降维[J]. 何进荣,丁立新,李照奎,胡庆辉. 软件学报. 2014(04)
[6]基于迭代Lasso的肿瘤分类信息基因选择方法研究[J]. 张靖,胡学钢,李培培,张玉红. 模式识别与人工智能. 2014(01)
[7]基于核空间距离测度的特征选择[J]. 蔡哲元,余建国,李先鹏,金震东. 模式识别与人工智能. 2010(02)
[8]利用协同分类方法识别癌症类型[J]. 卢新国,陈东,杜家宜,周娟. 计算机科学. 2010(02)
[9]基于邻域粒化和粗糙逼近的数值属性约简[J]. 胡清华,于达仁,谢宗霞. 软件学报. 2008(03)
[10]生物信息学中基因芯片的特征选择技术综述[J]. 周昉,何洁月. 计算机科学. 2007(12)
硕士论文
[1]基于监督学习的肿瘤特征基因选择方法研究[D]. 李涛.河南师范大学 2016
[2]肿瘤基因表达谱的数据挖掘与识别分类[D]. 郭志鹏.北京理工大学 2015
[3]基因表达数据的谱聚类方法研究[D]. 陈方.湖南大学 2015
[4]基于邻域互信息的特征基因选择方法研究[D]. 徐天贺.河南师范大学 2014
本文编号:2897830
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/2897830.html
最近更新
教材专著