基于线性回归模型的经编送经量预测研究
发布时间:2021-03-18 21:03
针对经编生产过程中送经量难以确定、调试费时费力且易造成资源浪费的问题,提出一种基于线性回归模型的送经量预测算法。以经编产品数据库中的大量产品工艺数据为基础,详细介绍经编工艺设计参数的筛选、模型的训练及工作原理,同时使用真实生产数据进行预测试验,并进行模型评估,给出模型改进方案。测试结果表明,模型的预测误差仅为10.57%,具有较好的拟合预测效果,同时可以通过增加特征数量、优化数据结构等方法使模型预测性能进一步提升。
【文章来源】:针织工业. 2020,(10)北大核心
【文章页数】:4 页
【部分图文】:
学习曲线
将属性变量与送经量结果分别作为横、纵坐标绘制散点图后发现,一些属性与最终送经量结果之间并非简单的线性关系,如牵拉密度与送经量的关系,如图2所示。由图2可知,牵拉密度与送经量呈负相关关系,且坐标点轨迹与曲线更贴合,因此,确定能够使用原有属性的多项式扩充原始数据集,从而修正模型高偏差的问题。
使用多项式属性的模型也被称为多项式回归,使用原本经编参数自身的高次项或多个参数的积生成新的属性[8],模型依然是线性模型,同样能够使用共轭梯度法进行学习。根据送经量相关研究,首先在数据集中添加牵拉密度的对数项ln C,而在继续加入多项式属性之前必须决定多项式属性的最高次数,最高次数与属性的数量直接相关。当属性数量足够大时,模型往往会产生高方差的问题,即过拟合,此时训练得到的模型过分偏向于拟合训练集A中的数据,对于测试集T中的数据则无法较好地预测,最终会严重影响模型的预测准确率。选择适当次数的多项式十分重要,然而此时仅将测试集T用于多项式模型的评估是不够客观的,会由于模型在单一测试集上的表现偏向而影响模型的选择。在多项式模型的评估与选择中,使用交叉验证划分法从数据集中额外划分出一个验证集V,用于评估不同次数多项式模型的性能来进行多项式次数选择,T用于评估多项式次数决定后训练得到的模型。使用不同次数多项式训练所得的模型与其对应的误差变化如图3所示。随着高次项次数的增加,模型对训练集的拟合效果越来越强,但在验证集上能观测到明显的高方差现象,图3中结果表明,多项式的最佳次数为2或3。根据模型在测试集上的最终表现,2次多项式模型与3次多项式模型的决定系数分别为0.803和0.724,所以最终选择2次多项式回归模型。
【参考文献】:
期刊论文
[1]基于设计任务聚合相似度的学习曲线建模方法[J]. 董洪亮,张剑,江磊,宋小欣. 机械制造与自动化. 2019(02)
[2]基于线性回归模型的菜花重量预测研究[J]. 郭霞霞,周桂红,程洪. 河北农业大学学报. 2019(01)
[3]基于混合随机共轭梯度的最小二乘逆时偏移[J]. 李闯,黄建平,李振春,王蓉蓉,孙苗苗. 石油地球物理勘探. 2018(06)
[4]基于梯度下降的脉冲神经元精确序列学习算法[J]. 杨静,赵欣,徐彦,姜赢. 计算机工程与应用. 2018(23)
[5]基于互联网的经编针织物CAD系统开发与实现[J]. 汤梦婷,蒋高明,王薇,高梓越. 纺织学报. 2018(10)
[6]组织工艺参数对经编送经量的影响[J]. 张吉生,蒋高明. 纺织学报. 2016(09)
[7]交叉验证K近邻算法分类研究[J]. 汪庆华,刘江炜,张兰兰. 西安工业大学学报. 2015(02)
[8]多项式回归的建模方法比较研究[J]. 付凌晖,王惠文. 数理统计与管理. 2004(01)
本文编号:3088930
【文章来源】:针织工业. 2020,(10)北大核心
【文章页数】:4 页
【部分图文】:
学习曲线
将属性变量与送经量结果分别作为横、纵坐标绘制散点图后发现,一些属性与最终送经量结果之间并非简单的线性关系,如牵拉密度与送经量的关系,如图2所示。由图2可知,牵拉密度与送经量呈负相关关系,且坐标点轨迹与曲线更贴合,因此,确定能够使用原有属性的多项式扩充原始数据集,从而修正模型高偏差的问题。
使用多项式属性的模型也被称为多项式回归,使用原本经编参数自身的高次项或多个参数的积生成新的属性[8],模型依然是线性模型,同样能够使用共轭梯度法进行学习。根据送经量相关研究,首先在数据集中添加牵拉密度的对数项ln C,而在继续加入多项式属性之前必须决定多项式属性的最高次数,最高次数与属性的数量直接相关。当属性数量足够大时,模型往往会产生高方差的问题,即过拟合,此时训练得到的模型过分偏向于拟合训练集A中的数据,对于测试集T中的数据则无法较好地预测,最终会严重影响模型的预测准确率。选择适当次数的多项式十分重要,然而此时仅将测试集T用于多项式模型的评估是不够客观的,会由于模型在单一测试集上的表现偏向而影响模型的选择。在多项式模型的评估与选择中,使用交叉验证划分法从数据集中额外划分出一个验证集V,用于评估不同次数多项式模型的性能来进行多项式次数选择,T用于评估多项式次数决定后训练得到的模型。使用不同次数多项式训练所得的模型与其对应的误差变化如图3所示。随着高次项次数的增加,模型对训练集的拟合效果越来越强,但在验证集上能观测到明显的高方差现象,图3中结果表明,多项式的最佳次数为2或3。根据模型在测试集上的最终表现,2次多项式模型与3次多项式模型的决定系数分别为0.803和0.724,所以最终选择2次多项式回归模型。
【参考文献】:
期刊论文
[1]基于设计任务聚合相似度的学习曲线建模方法[J]. 董洪亮,张剑,江磊,宋小欣. 机械制造与自动化. 2019(02)
[2]基于线性回归模型的菜花重量预测研究[J]. 郭霞霞,周桂红,程洪. 河北农业大学学报. 2019(01)
[3]基于混合随机共轭梯度的最小二乘逆时偏移[J]. 李闯,黄建平,李振春,王蓉蓉,孙苗苗. 石油地球物理勘探. 2018(06)
[4]基于梯度下降的脉冲神经元精确序列学习算法[J]. 杨静,赵欣,徐彦,姜赢. 计算机工程与应用. 2018(23)
[5]基于互联网的经编针织物CAD系统开发与实现[J]. 汤梦婷,蒋高明,王薇,高梓越. 纺织学报. 2018(10)
[6]组织工艺参数对经编送经量的影响[J]. 张吉生,蒋高明. 纺织学报. 2016(09)
[7]交叉验证K近邻算法分类研究[J]. 汪庆华,刘江炜,张兰兰. 西安工业大学学报. 2015(02)
[8]多项式回归的建模方法比较研究[J]. 付凌晖,王惠文. 数理统计与管理. 2004(01)
本文编号:3088930
本文链接:https://www.wllwen.com/projectlw/qgylw/3088930.html