基于图正则低秩表示的基因表达谱数据特征选择算法研究
发布时间:2020-03-21 02:17
【摘要】:随着人类基因组计划的高速发展,DNA芯片技术被广泛地应用到生命科学的各个领域,利用得到的基因表达谱数据可以从微观世界描述出各个基因的表达状态,所以被成功用于癌症的诊断与治疗等研究领域,为人类的发展开启了新的大门,成为学术界一个热门的研究方向。然而,基因表达谱数据“高维小样本”等特点会降低癌症基因的识别准确率,所以必须采用适当的数据处理办法进行有效的降维,准确高效的挑选出与致病基因相关的特征基因子集就成为一项具有深远意义的研究工作。本文通过结合生物学知识和机器学习中的相关理论,对癌症基因进行特征选择,并对相应的实验结果进行有效性分析,完成的主要工作如下:1.提出了一种基于图正则低秩评分的基因表达谱特征选择算法。为了准确表达数据本质属性,考虑到低秩表示算法是从全局观点出发揭示数据样本的整体结构信息,但没有考虑数据的局部流形结构,在此基础上引入具有局部保持能力的流形正则约束项,构建一种图正则低秩表示模型。通过求解此模型得到系数矩阵,进一步构造出图权值矩阵,然后代替拉氏评分中的相似度矩阵,从而形成一种新的评分方式用于DNA表达数据的特征选择,称之为图正则低秩评分算法。最后在基因表达谱数据集上进行聚类实验,同传统的评分算法相比较,该算法取得更好的聚类效果。2.提出了一种基于图正则平滑低秩表示的基因表达谱特征选择算法。在低秩表示中,通过数据矩阵本身作为字典进行联合线性表示每个数据点,并且利用最小化核范数作为秩函数的凸包络来获得理想的低秩表示。但是在实际应用中,它的表现可能会偏离原始问题的最优解,因为核范数不是秩函数的凸松弛最优的选择。针对此问题,在构造目标函数时,利用对数行列式函数取代核范数更加准确的逼近秩函数,同时加上揭示数据局部近邻结构的图正则项,构建一种图正则平滑低秩表示模型,并且对得到的系数矩阵后处理之后再构造数据图结构。最后在基因表达谱数据集上进行聚类实验,与传统的特征选择算法相比较,该算法有更高的聚类准确率。
【图文】:
分析和处理也成为微阵列技术中关键的一环[29]。谱数据的获取表达谱的数据时,大体可以分为第一步芯片制备,将 cDNA成的方式并列的固定到特殊的玻璃面板上,形成一个矩阵者同位素去标记试验样品,,一般都是将训练的样本和测试色的荧光进行标识,然后再将这两种样本按照同样的比,将标记好的样品与制备好的芯片按照规定的试验条件进行混合样本与探针 cDNA 进行杂交与清洗;第四步检测分样品进行取点检测,在扫描仪中选择不同的波长对处理过后光在不同的波长下它的光值强弱不同,因此可以对得到的光信号的强弱比例进行评测,分析此点上信号表达强度从而30]。
归一化互信息与选择的基因特征数的关系
【学位授予单位】:江西理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:Q811.4;TP181
本文编号:2592580
【图文】:
分析和处理也成为微阵列技术中关键的一环[29]。谱数据的获取表达谱的数据时,大体可以分为第一步芯片制备,将 cDNA成的方式并列的固定到特殊的玻璃面板上,形成一个矩阵者同位素去标记试验样品,,一般都是将训练的样本和测试色的荧光进行标识,然后再将这两种样本按照同样的比,将标记好的样品与制备好的芯片按照规定的试验条件进行混合样本与探针 cDNA 进行杂交与清洗;第四步检测分样品进行取点检测,在扫描仪中选择不同的波长对处理过后光在不同的波长下它的光值强弱不同,因此可以对得到的光信号的强弱比例进行评测,分析此点上信号表达强度从而30]。
归一化互信息与选择的基因特征数的关系
【学位授予单位】:江西理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:Q811.4;TP181
【参考文献】
相关期刊论文 前2条
1 昂清;王卫东;王国静;彭福来;;基于信息学理论的基因数据挖掘研究[J];中国医疗器械杂志;2012年04期
2 王年;庄振华;唐俊;苏亮亮;;基于Fiedler向量的基因表达谱数据分类方法[J];中国生物工程杂志;2010年12期
相关硕士学位论文 前10条
1 谢乃俊;低秩矩阵恢复在维数约简中的研究与应用[D];江西理工大学;2015年
2 田贝贝;基于流形学习和多任务学习的肿瘤基因表达数据分类方法研究[D];武汉科技大学;2015年
3 姚唐龙;基因表达谱数据挖掘的特征提取方法研究[D];安徽大学;2015年
4 刘金勇;基因表达谱数据特征选择与提取方法研究[D];中国计量学院;2014年
5 许露;基于SVM-RFE和粒子群算法的特征选择算法研究[D];湖南师范大学;2014年
6 贺予迪;基于流形学习和低秩表示的维数约减算法研究[D];西安电子科技大学;2014年
7 刘玉堂;基于互信息网络的疾病关键基因选取[D];中国海洋大学;2013年
8 葛芳;肿瘤基因表达谱数据聚类的谱方法研究[D];安徽大学;2013年
9 黄丹凤;基因微阵列数据特征选择与分类方法研究[D];江苏科技大学;2012年
10 王思漫;基于基因表达谱的肿瘤分类方法研究[D];南京理工大学;2012年
本文编号:2592580
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/2592580.html
最近更新
教材专著