当前位置:主页 > 医学论文 > 中药论文 >

偏最小二乘优化及其在中医药数据分析中的应用研究

发布时间:2020-03-21 05:40
【摘要】:中医药物质基础研究是中医药现代化的重要内容,通常采用高效液相和质谱联用仪来获取实验数据。此类实验数据通常包含成千上万种物质,呈现出高维数据特点;同时由于实验样本数的限制,呈现出小样本的特点。中医方药在治病的过程中,往往呈现出多成分、多疗效以及非线性的特性,而中医药实验过程复杂、时间长、实验动物有限以及一些客观因素造成的实验误差等原因,导致有效实验数据样本较少。中医药领域的数据的复杂性使其难以直接使用传统的机器学习方法进行分析。因而,需要对数据进行适当的处理,使其能够适用于传统的数据分析模型。本文主要是基于偏最小二乘的优化对中医药数据进行处理,偏最小二乘的优化主要从特征选择、非线性特征提取和回归模型的非线性改进三方面着手。本文所做的主要工作有:(1)提出了一种基于特征相关的偏最小二乘特征选择方法。针对传统的偏最小二乘法只考虑单特征的重要性以及特征之间存在冗余和多重共线性等问题,将特征之间的统计相关性引入到传统的偏最小二乘分析中,构造了一种基于特征相关的偏最小二乘模型。首先利用特征相关度对特征进行评估预选出特征组,然后将其放入偏最小二乘模型中进行训练,评估该特征组是否可取。结合前向贪心搜索策略依次评价候选特征,并选中使目标函数最小的候选特征加入到已选特征。分别采用麻杏石甘汤君药止咳、平喘和UCI数据集进行分析处理,实验结果表明,该特征选择方法能较好寻找较优的特征组。(2)提出一种融合随机森林的偏最小二乘法方法。针对偏最小二乘法的线性本质,而随机森林算法组合多个分类器,具有自适应性,适合非线性回归。将偏最小二乘法外模型中的提取的自变量主成分和原始因变量构建随机森林,根据残差信息递归建树,直到满足事先设定的条件为止。在麻杏石甘汤君药平喘实验、麻杏石甘汤君药止咳实验和UCI机器学习数据集上进行了实验分析,结果表明,融入随机森林的偏最小二乘法能较好表达中医药数据的特征,提高非线性数据的预测精度。(3)提出一种基于深度置信网络的偏最小二乘法优化方法。针对偏最小二乘内部采用的交叉核验方法会导致主成分急剧减少,从而降低回归方程的精度,而中医药数据对主成分的选取尤为敏感。该方法主要是利用深度学习模型抽取原始数据的上层特征,将抽取的特征放入偏最小二乘模型进行多元线性回归,在规避对主成分的个数选取问题的同时,还反应了中医药数据中所包含的非线性结构。分别采用大承气汤实验数据和UCI数据集的数据进行分析处理,实验结果表明,基于深度置信网络的偏最小二乘分析方法对中医药数据有很好的适应性。(4)针对参附注射液治疗心源性休克的物质基础实验数据展开分析,首先将原始数据的内源性物质和外源性物质区分开,使用单因素方差分析对数据进行预处理,去掉那些取值变化小的特征,采用十一种有监督的单变量特征选择方法,对剩余的内源性物质进行特征重要性排序,取重要特征的交集。再利用无监督的特征选择方法去除冗余特征。将所得特征集合作为生物标记物(内源性物质)。最后,通过所得的生物标记物分析外源性和内源性物质之间的关系。(5)在基于以上研究成果的基础上,按照中医药领域的数据分析需求,采用PYTHON相关编程语言和开发工具,设计并开发了中医药数据分析系统。
【图文】:

房价,预测图,过拟合,惩罚项


图 2.1 房价真实预测图 图 2.2 房价过拟合预测图0 1 2 2 13 13θ + θ x + θ x + ...+ θx(6)0 1 2 2 3 3 4 4 13 13θ + θ x + θ x + θ x + θ x ...+ θx(7)可以看出,左图拟合较为合适,而右图过拟合。如果想要解决右图中的过拟合问题,需要3 4x ,x 能够使得的参数3 4θ ,θ ,尽量满足3 4θ ≈ 0, θ≈ 0。而如何使得3 4θ ,θ 尽可能接近 0 呢?那就是对参数施惩罚项。线性回归的代价函数:21( ) (12( ) )ni iiJ h x ymθθ== (8)施加惩罚项之后,公式为:2 21 0( ) ( ) )12(n ki i ji jJ h x ymθθ λ θ= == + (9)梯度下降的式子变为:

过拟合,房价,预测图,惩罚项


图 2.1 房价真实预测图 图 2.2 房价过拟合预测图0 1 2 2 13 13θ + θ x + θ x + ...+ θx(6)0 1 2 2 3 3 4 4 13 13θ + θ x + θ x + θ x + θ x ...+ θx(7)可以看出,,左图拟合较为合适,而右图过拟合。如果想要解决右图中的过拟合问题,需要3 4x ,x 能够使得的参数3 4θ ,θ ,尽量满足3 4θ ≈ 0, θ≈ 0。而如何使得3 4θ ,θ 尽可能接近 0 呢?那就是对参数施惩罚项。线性回归的代价函数:21( ) (12( ) )ni iiJ h x ymθθ== (8)施加惩罚项之后,公式为:2 21 0( ) ( ) )12(n ki i ji jJ h x ymθθ λ θ= == + (9)梯度下降的式子变为:
【学位授予单位】:江西中医药大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R285;TP181

【相似文献】

相关期刊论文 前10条

1 尤肖虎,何振亚;递归实现固定阶的偏最小二乘问题——几种新的快速算法[J];电子学报;1988年02期

2 倪永年;偏最小二乘分光光度法用于多组份分析[J];岩矿测试;1989年04期

3 康健;唐力伟;左宪章;李浩;张西红;;基于灰色小波核偏最小二乘的传感器网络数据预测融合研究[J];振动与冲击;2011年04期

4 张胜伟;秦斌;;偏最小二乘方法的财务预警模型研究的应用[J];工业控制计算机;2012年06期

5 贺军亮;崔军丽;张淑媛;李仁杰;查勇;;基于偏最小二乘的土壤重金属铜含量高光谱估算[J];遥感技术与应用;2019年05期

6 姜英英;李晋明;;偏最小二乘通径模型在某高校学院综合实力评估中的实证研究(下)[J];教育教学论坛;2015年27期

7 杜树新;沈进昌;袁之报;;三维荧光光谱的多维偏最小二乘建模方法[J];激光杂志;2012年01期

8 姜英英;李晋明;;偏最小二乘通径模型在某高校学院综合实力评估中的实证研究(上)[J];教育教学论坛;2015年23期

9 陈安珍;蒋万枫;袁航;孙磊;吴爱英;李新荣;马双成;;基于超高效液相色谱偏最小二乘判别分析法建立鉴别大黄真伪及种属预测模型的方法[J];中国药学杂志;2016年03期

10 常鹏;高学金;王普;;基于多向核熵偏最小二乘的间歇过程监测及质量预测[J];北京工业大学学报;2014年06期

相关会议论文 前10条

1 李科;;用偏最小二乘(PLS)回归法研究数据相关性[A];全国第六届分子振动光谱学术报告会文集[C];1990年

2 徐扬;胡文明;王伟;徐辰武;;基于多元偏最小二乘的多性状联合关联分析方法研究[A];第六届全国动植物数量遗传学学术研讨会论文摘要集[C];2014年

3 王检兵;曹东升;梁逸曾;;3褼_(7.4)的计算机预测并与其他软件方法比较[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年

4 李大鹏;王惠文;;偏最小二乘Iogistic回归在鄱阳湖洪涝灾害预测中的应用[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年

5 王俊;许多宽;肖勇;王勇;陈志华;陈维建;;基于化学指标的烟叶产区正交偏最小二乘判别分析[A];中国烟草学会学术年会优秀论文集[C];2017年

6 樊霞;俞舟;;产学研协同创新有助于大学创新能力成长吗?——基于偏最小二乘路径模型的实证检验[A];中国系统工程学会第十八届学术年会论文集——A03系统科学理论研究创新[C];2014年

7 景明;蔡文生;邵学广;;Multiblock偏最小二乘方法的新应用[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年

8 岑芳明;王明文;王鹏鸣;戴玉娟;;基于核偏最小二乘分类的垃圾邮件过滤[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

9 李泽华;赵春晖;王伟;;一种基于稀疏偏最小二乘-典型相关分析(SPLS-CCA)的产品质量智能追溯方法[A];2018中国自动化大会(CAC2018)论文集[C];2018年

10 李建更;李辉;阮晓钢;;一种有效的肿瘤特征基因筛选方法[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年

相关博士学位论文 前10条

1 曾雪强;偏最小二乘降维方法的研究与应用[D];上海大学;2009年

2 池清华;PLS隐变量空间模型预测控制算法研究[D];浙江大学;2015年

3 杨海涛;基于遗传算法的复合核偏最小二乘模型在组学数据疾病预测和分类中的应用[D];山西医科大学;2016年

4 石怀涛;基于多元统计分析的轧钢过程故障诊断与质量预报研究[D];东北大学;2012年

5 张海玉;张广才岭及完达山森林生物量遥感估测及变化驱动力分析[D];东北林业大学;2011年

6 田明璐;西北地区冬小麦生长状况高光谱遥感监测研究[D];西北农林科技大学;2017年

7 金鑫;基于动态PLS框架的鲁棒建模及预测控制方法研究[D];浙江大学;2016年

8 毛李帆;电网规划中长期负荷预测技术的研究[D];湖南大学;2011年

9 华回春;干扰性负荷谐波责任定量评估的理论与方法[D];华北电力大学;2014年

10 李明泽;东北林区森林生物量遥感估算及分析[D];东北林业大学;2010年

相关硕士学位论文 前10条

1 叶震麟;一种块增量偏最小二乘模型的研究[D];南昌大学;2019年

2 曾青霞;偏最小二乘优化及其在中医药数据分析中的应用研究[D];江西中医药大学;2019年

3 刘爽;混合溶液光谱分析与融合建模研究[D];东北大学;2015年

4 王岩;基于回归系数误差逐渐调优的增量偏最小二乘算法研究[D];东北大学;2015年

5 赵丙娟;基于偏最小二乘降维的人脸年龄估计研究[D];南昌大学;2017年

6 郑明辰;基于非线性偏最小二乘方法的急性电离辐射损伤早期伤情分类研究[D];苏州大学;2013年

7 杜晓慧;基于不同罚函数约束偏最小二乘的应用研究[D];长沙理工大学;2015年

8 韩杰伦;使用偏最小二乘方法对信令负荷进行评估[D];浙江大学;2017年

9 步文斌;基于偏最小二乘的人脸识别算法研究[D];重庆大学;2013年

10 张凯林;基于主元分析和偏最小二乘的TE过程监测方法的研究[D];天津理工大学;2015年



本文编号:2592855

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/zhongyaolw/2592855.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户52e6b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com