基于主成分分析的基因表达谱数据降维方法研究及可视化
发布时间:2020-12-04 18:07
“21世纪是生物技术的世纪”,随着时代的发展,基因测序技术及其他生物信息学技术正在改变着世界。其中基因表达谱数据收集和处理技术已经越来越成熟和多样,海量数据的规模和复杂度在不断增加,例如:基因组数据库、核酸和蛋白质结构序列数据库、生物大分子空间结构信息等。然而随着“大数据时代”的来临,问题也随之而来,如此大规模的数据带来的更多的是高维、海量和不完整性等巨大挑战。关于基因表达谱数据降维技术的创新与研究也在不断地更新迭代,并取得了可观的成果。主成分回归分析作为一种经典的算法得到了非常广泛的应用,并且针对不同领域演变出了许多改进和变种算法。但是它们主要是针对样本数据本身进行优化和改进,并没有将其与分类标签结合起来,这就容易导致丢失感兴趣目标信息,无法良好地发现数据潜在的内部结构关系,进而影响预测和分类性能。针对此类问题,课题研究了有监督主成分回归(Supervised Principal Component Regression SPCR)和基于Y-aware的主成分回归方法,验证了其相对于PCR方法的优越性。通过实验发现,SPCR方法随着保留主成分数量的增多,分类效果逐渐变差,而Y-awa...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
Cytoscape本地单机与Web端数据可视化示例
不同主成分数下各算法分类准确率
图 3-3 不同特征数下 SPCR 与 Y-aware PCR 性能对比法原理可以发现,SPCR 实际是对原始数据 X 进行了一与因变量 Y 弱相关的信息直接从 X 中去掉,这种做法难主成分数排在 20 以后的特征)中可能包含有更深层次
【参考文献】:
期刊论文
[1]一种改进的主成分分析特征抽取算法:YJ-MICPCA[J]. 谢昆明,罗幼喜. 武汉科技大学学报. 2019(03)
[2]改进PCA-LDA的人脸识别算法研究[J]. 马帅旗. 陕西理工大学学报(自然科学版). 2019(02)
[3]基于SM2和奇异值分解(SVD)的指纹水印身份认证算法[J]. 郭蕾,刘福平,李诗珂,庞建萍. 北京印刷学院学报. 2019(02)
[4]基因表达谱数据分类算法综述[J]. 张奇,荣雯雯,刘艳. 实用预防医学. 2018(08)
[5]改进的分段主成分分析算法及其在前列腺分割中的应用[J]. 宋建萍,石勇涛. 现代电子技术. 2018(13)
[6]高维数据降维技术及研究进展[J]. 刘靖,赵逢禹. 电子科技. 2018(03)
[7]三种统计分析方法在基因表达谱数据中的比较研究[J]. 史晓雯,肖纯,刘芸良,刘艳. 实用预防医学. 2018(02)
[8]有监督主成分回归法在近红外光谱定量分析中的应用研究[J]. 刘旭华,徐兴忠,何雄奎,张录达. 光谱学与光谱分析. 2009(11)
博士论文
[1]生物信息数据分析的若干问题研究[D]. 范业田.大连理工大学 2017
[2]基因表达谱的数据挖掘方法研究[D]. 陈涛.西北工业大学 2016
[3]高维数据降维可视化研究及其在生物医学中的应用[D]. 徐微微.武汉大学 2016
[4]核方法的研究及其应用[D]. 牟少敏.北京交通大学 2008
硕士论文
[1]基于双线性概率主成分分析的聚类算法研究[D]. 孙小军.云南财经大学 2018
[2]基于高通量基因数据的可视化在线诊断工具[D]. 孙策.哈尔滨工业大学 2018
[3]基于传统特征提取和深度学习方法相结合的基因表达数据降维研究[D]. 郜园园.西安电子科技大学 2018
[4]基于Web的中药作用机理的网络可视化研究[D]. 杨明辉.兰州大学 2018
[5]基于Web前端数据可视化研究与应用[D]. 王水波.西安电子科技大学 2017
[6]基于神经网络的全基因组DNA甲基化预测研究[D]. 刘光辉.大连海事大学 2017
[7]DNA甲基化状态在线预测平台的设计与实现[D]. 李承哲.电子科技大学 2016
本文编号:2898025
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
Cytoscape本地单机与Web端数据可视化示例
不同主成分数下各算法分类准确率
图 3-3 不同特征数下 SPCR 与 Y-aware PCR 性能对比法原理可以发现,SPCR 实际是对原始数据 X 进行了一与因变量 Y 弱相关的信息直接从 X 中去掉,这种做法难主成分数排在 20 以后的特征)中可能包含有更深层次
【参考文献】:
期刊论文
[1]一种改进的主成分分析特征抽取算法:YJ-MICPCA[J]. 谢昆明,罗幼喜. 武汉科技大学学报. 2019(03)
[2]改进PCA-LDA的人脸识别算法研究[J]. 马帅旗. 陕西理工大学学报(自然科学版). 2019(02)
[3]基于SM2和奇异值分解(SVD)的指纹水印身份认证算法[J]. 郭蕾,刘福平,李诗珂,庞建萍. 北京印刷学院学报. 2019(02)
[4]基因表达谱数据分类算法综述[J]. 张奇,荣雯雯,刘艳. 实用预防医学. 2018(08)
[5]改进的分段主成分分析算法及其在前列腺分割中的应用[J]. 宋建萍,石勇涛. 现代电子技术. 2018(13)
[6]高维数据降维技术及研究进展[J]. 刘靖,赵逢禹. 电子科技. 2018(03)
[7]三种统计分析方法在基因表达谱数据中的比较研究[J]. 史晓雯,肖纯,刘芸良,刘艳. 实用预防医学. 2018(02)
[8]有监督主成分回归法在近红外光谱定量分析中的应用研究[J]. 刘旭华,徐兴忠,何雄奎,张录达. 光谱学与光谱分析. 2009(11)
博士论文
[1]生物信息数据分析的若干问题研究[D]. 范业田.大连理工大学 2017
[2]基因表达谱的数据挖掘方法研究[D]. 陈涛.西北工业大学 2016
[3]高维数据降维可视化研究及其在生物医学中的应用[D]. 徐微微.武汉大学 2016
[4]核方法的研究及其应用[D]. 牟少敏.北京交通大学 2008
硕士论文
[1]基于双线性概率主成分分析的聚类算法研究[D]. 孙小军.云南财经大学 2018
[2]基于高通量基因数据的可视化在线诊断工具[D]. 孙策.哈尔滨工业大学 2018
[3]基于传统特征提取和深度学习方法相结合的基因表达数据降维研究[D]. 郜园园.西安电子科技大学 2018
[4]基于Web的中药作用机理的网络可视化研究[D]. 杨明辉.兰州大学 2018
[5]基于Web前端数据可视化研究与应用[D]. 王水波.西安电子科技大学 2017
[6]基于神经网络的全基因组DNA甲基化预测研究[D]. 刘光辉.大连海事大学 2017
[7]DNA甲基化状态在线预测平台的设计与实现[D]. 李承哲.电子科技大学 2016
本文编号:2898025
本文链接:https://www.wllwen.com/projectlw/swxlw/2898025.html
教材专著