模式识别在复杂基体样品直接质谱快速分析中的应用研究
发布时间:2024-03-01 04:32
随着计算机技术和检测技术的持续进步和不断发展,获得的仪器数据正在迅速增长,各类的数据库也层出不穷。如何从大量检测数据中发现事物间所存在的特征和规律是当代学者亟待解决的主要课题。模式识别是当前对采集后的数据信息进行分析并挖掘的最佳方法之一,并已在众多领域得到广泛应用。本文利用偏最小二乘法线性判别分析(PLS-LDA)、随机森林(RF)、偏最小二乘法(PLS)、主成分分析(PCA)等模式识别方法分别对肺癌、水质和茶叶的质谱数据展开模式识别分析,同时建立了相应的分类识别模型,取得了较好的结果,为模式识别方法在质谱数据中的应用提供了新的研究思路。本文的主要研究内容包括:(1)建立了一种基于偏最小二乘法线性判别分析(PLS-LDA)的肺癌诊断模型。采用电喷雾萃取电离质谱对肺癌组织和正常组织进行直接质谱分析,结合偏最小二乘法线性判别分析(PLS-LDA)对肺癌组织和正常组织的质谱数据进行模式判别,并对组织样本中存在的潜在生物标记物进行了鉴别和分析,为未来进一步探究肺癌的发生、生长规律及寻找潜在的生物标记物奠定基础。(2)建立了两种基于随机森林(RF)的水质直接质谱分类模型。对五类地表水进行直接质谱...
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.2 模式识别的常用方法及应用
1.2.1 主成分分析(Principal component analysis,PCA)
1.2.2 偏最小二乘法(Partial Least Squares,PLS)
1.2.3 线性判别分析(Linear Discriminant Analysis,LDA)
1.2.4 随机森林算法(Random forest,RF)
1.2.5 人工神经网络(Artificial Neural Networks,ANN)
1.2.6 支持向量机算法(Support Vector Machine,SVM)
1.2.7 聚类算法
1.2.7.1 k-means聚类算法
1.2.7.2 层次聚类算法
1.2.7.3 自组织神经映射(Self-organizing Feature Map,SOM)聚类算法
1.2.7.4 模糊C均值(Fuzzy C-means,FCM)聚类算法
1.3 本文的主要研究内容和创新点
第二章 基于偏最小二乘法线性判别分析(PLS-LDA)建立的肺癌诊断模型
2.1 引言
2.2 实验部分
2.2.1 仪器试剂
2.2.2 实验组织样品的收集及制备
2.2.3 实验参数及条件
2.2.4 实验方法
2.2.5 数据处理
2.3 结果与讨论
2.3.1 实验条件优化
2.3.2 肺癌组织样品的一级质谱分析
2.3.3 偏最小二乘法线性判别分析(PLS-LDA)
2.4 小结
第三章 基于随机森林算法(RF)建立的水质信息模型
3.1 引言
3.2 实验部分
3.2.1 仪器与试剂
3.2.2 样本的采集及制备
3.2.3 EESI工作原理及其实验参数
3.2.4 TOF-MS工作原理
3.2.5 数据处理
3.3 结果与讨论
3.3.1 水样的质谱分析
3.3.1.1 五类水质水样的EESI-TOF-MS一级扫描谱图
3.3.1.2 不同含量的重金属Cu离子水样的EESI-LTQ-MS一级扫描谱图
3.3.2 随机森林(RF)分析模型
3.3.2.1 EESI-TOF-MS实验下的五类水质水样的随机森林(RF)模式识别模型
3.3.2.2 EESI-LTQ-MS实验下的五类水质水样的随机森林(RF)模式识别模型
3.3.2.3 三类不同含量重金属Cu离子水样的随机森林(RF)模式识别模型
3.4 小结
第四章 基于偏最小二乘法(PLS)和随机森林算法(RF)建立的茶叶分类模型
4.1 引言
4.2 实验部分
4.2.1 仪器与试剂
4.2.2 实验条件及参数
4.2.3 数据处理
4.3 结果与讨论
4.3.1 茶叶品种的鉴别
4.3.1.1 基于偏最小二乘法(PLS)建立的茶叶品种模式识别模型
4.3.1.2 基于随机森林算法(RF)建立的茶叶品种模式识别模型
4.3.2 茶叶产地的鉴别
4.3.2.1 基于偏最小二乘法(PLS)建立的茶叶产地模式识别模型
4.3.2.2 基于随机森林算法(RF)建立的茶叶产地模式识别模型
4.4 小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
附录
致谢
本文编号:3915427
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.2 模式识别的常用方法及应用
1.2.1 主成分分析(Principal component analysis,PCA)
1.2.2 偏最小二乘法(Partial Least Squares,PLS)
1.2.3 线性判别分析(Linear Discriminant Analysis,LDA)
1.2.4 随机森林算法(Random forest,RF)
1.2.5 人工神经网络(Artificial Neural Networks,ANN)
1.2.6 支持向量机算法(Support Vector Machine,SVM)
1.2.7 聚类算法
1.2.7.1 k-means聚类算法
1.2.7.2 层次聚类算法
1.2.7.3 自组织神经映射(Self-organizing Feature Map,SOM)聚类算法
1.2.7.4 模糊C均值(Fuzzy C-means,FCM)聚类算法
1.3 本文的主要研究内容和创新点
第二章 基于偏最小二乘法线性判别分析(PLS-LDA)建立的肺癌诊断模型
2.1 引言
2.2 实验部分
2.2.1 仪器试剂
2.2.2 实验组织样品的收集及制备
2.2.3 实验参数及条件
2.2.4 实验方法
2.2.5 数据处理
2.3 结果与讨论
2.3.1 实验条件优化
2.3.2 肺癌组织样品的一级质谱分析
2.3.3 偏最小二乘法线性判别分析(PLS-LDA)
2.4 小结
第三章 基于随机森林算法(RF)建立的水质信息模型
3.1 引言
3.2 实验部分
3.2.1 仪器与试剂
3.2.2 样本的采集及制备
3.2.3 EESI工作原理及其实验参数
3.2.4 TOF-MS工作原理
3.2.5 数据处理
3.3 结果与讨论
3.3.1 水样的质谱分析
3.3.1.1 五类水质水样的EESI-TOF-MS一级扫描谱图
3.3.1.2 不同含量的重金属Cu离子水样的EESI-LTQ-MS一级扫描谱图
3.3.2 随机森林(RF)分析模型
3.3.2.1 EESI-TOF-MS实验下的五类水质水样的随机森林(RF)模式识别模型
3.3.2.2 EESI-LTQ-MS实验下的五类水质水样的随机森林(RF)模式识别模型
3.3.2.3 三类不同含量重金属Cu离子水样的随机森林(RF)模式识别模型
3.4 小结
第四章 基于偏最小二乘法(PLS)和随机森林算法(RF)建立的茶叶分类模型
4.1 引言
4.2 实验部分
4.2.1 仪器与试剂
4.2.2 实验条件及参数
4.2.3 数据处理
4.3 结果与讨论
4.3.1 茶叶品种的鉴别
4.3.1.1 基于偏最小二乘法(PLS)建立的茶叶品种模式识别模型
4.3.1.2 基于随机森林算法(RF)建立的茶叶品种模式识别模型
4.3.2 茶叶产地的鉴别
4.3.2.1 基于偏最小二乘法(PLS)建立的茶叶产地模式识别模型
4.3.2.2 基于随机森林算法(RF)建立的茶叶产地模式识别模型
4.4 小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
附录
致谢
本文编号:3915427
本文链接:https://www.wllwen.com/kejilunwen/huaxue/3915427.html
教材专著