铸坯质量缺陷预测的特征降维方法研究
发布时间:2020-12-20 07:19
为提高铸坯质量预测的准确率,本文提出了一种基于最大信息系数(MIC)和主成分分析(PCA)的两阶段特征降维方法。采集某钢厂铸坯生产过程数据,根据冶金原理得到铸坯夹杂类质量缺陷的影响因素,构造原始特征集。第一阶段进行特征选择,使用随机森林分类器的分类准确率来评价ReliefF、IG和MIC三种算法的特征选择效果,结果显示,基于MIC度量指标选出的特征维度更低、分类准确率更高。第二阶段使用PCA方法对特征选择后的特征集进行降维,并将其与原始特征集、MIC、PCA算法的分类准确率进行比较,结果表明,本文提出的基于MIC和PCA的两阶段降维方法优于其他算法,能有效降低原始特征集的维度并提高对铸坯夹杂类质量缺陷的预测精度。
【文章来源】:武汉科技大学学报. 2020年05期 北大核心
【文章页数】:6 页
【部分图文】:
图1 两阶段特征降维方法框图
由图3还可见,采用MIC算法时,在删除8维特征时分类准确率最高可达89.0%,与未进行特征选择的情况相比,分类准确率提高了约4.2%;使用ReliefF算法,在删除4维特征时准确率最高为88.1%;使用IG算法,在删除5维特征时准确率最高为86.4%。综合来看,使用MIC度量指标进行特征选择,可以选出维度更低、分类准确率更高的特征,特征选择效果优于其他两类度量指标。因此,根据MIC算法的特征选择结果,删除相关性较小的8维特征后,保留与铸坯夹杂类质量缺陷相关的14个特征为:钢种、废钢加入量、结晶器渣类型、吹氧量、长水口厂家、中包渣类型、断面宽度、配水方式、精炼方式、水表号、钢水节奏、中包吨位、中包温度和拉速落差。
应用随机森林分类器对3种度量指标进行评价时,依次删除相关性较小的特征,直至剩下一维特征为止,不同算法的分类准确率随删除特征数量(即数据集维度)的变化如图3所示。由图3可以看出,伴随着相关性较小特征的删除,3种算法的分类准确率与起点处相比均有所提升,而当相关性较高特征被删除时,模型的分类准确率则随之下降。图2 基于三种不同算法的特征排序
【参考文献】:
期刊论文
[1]铸坯质量判定系统的研究与应用[J]. 王红涛,冯连强,刘颖,周士凯,赵静. 重型机械. 2018(03)
[2]特征选择方法中三种度量的比较研究[J]. 宋智超,康健,孙广路,何勇军. 哈尔滨理工大学学报. 2018(01)
[3]基于随机森林与主成分分析的刀具磨损评估[J]. 赵帅,黄亦翔,王浩任,刘成良,刘晓,梁鑫光. 机械工程学报. 2017(21)
[4]基于邻域粗糙集的多标记分类特征选择算法[J]. 段洁,胡清华,张灵均,钱宇华,李德玉. 计算机研究与发展. 2015(01)
[5]连铸大方坯内部质量多元模糊模式预测研究[J]. 王宝,张志刚,陈海芳,刘青. 计算机与应用化学. 2012(12)
[6]连铸坯质量判定系统研究综述[J]. 单多,徐安军,汪红兵,田乃媛. 连铸. 2011(02)
硕士论文
[1]基于随机森林算法的铸件内部夹杂类型识别方法研究[D]. 李璐.中北大学 2018
[2]基于神经元网络技术的铸坯质量分析算法研究[D]. 韩舟.大连理工大学 2017
本文编号:2927460
【文章来源】:武汉科技大学学报. 2020年05期 北大核心
【文章页数】:6 页
【部分图文】:
图1 两阶段特征降维方法框图
由图3还可见,采用MIC算法时,在删除8维特征时分类准确率最高可达89.0%,与未进行特征选择的情况相比,分类准确率提高了约4.2%;使用ReliefF算法,在删除4维特征时准确率最高为88.1%;使用IG算法,在删除5维特征时准确率最高为86.4%。综合来看,使用MIC度量指标进行特征选择,可以选出维度更低、分类准确率更高的特征,特征选择效果优于其他两类度量指标。因此,根据MIC算法的特征选择结果,删除相关性较小的8维特征后,保留与铸坯夹杂类质量缺陷相关的14个特征为:钢种、废钢加入量、结晶器渣类型、吹氧量、长水口厂家、中包渣类型、断面宽度、配水方式、精炼方式、水表号、钢水节奏、中包吨位、中包温度和拉速落差。
应用随机森林分类器对3种度量指标进行评价时,依次删除相关性较小的特征,直至剩下一维特征为止,不同算法的分类准确率随删除特征数量(即数据集维度)的变化如图3所示。由图3可以看出,伴随着相关性较小特征的删除,3种算法的分类准确率与起点处相比均有所提升,而当相关性较高特征被删除时,模型的分类准确率则随之下降。图2 基于三种不同算法的特征排序
【参考文献】:
期刊论文
[1]铸坯质量判定系统的研究与应用[J]. 王红涛,冯连强,刘颖,周士凯,赵静. 重型机械. 2018(03)
[2]特征选择方法中三种度量的比较研究[J]. 宋智超,康健,孙广路,何勇军. 哈尔滨理工大学学报. 2018(01)
[3]基于随机森林与主成分分析的刀具磨损评估[J]. 赵帅,黄亦翔,王浩任,刘成良,刘晓,梁鑫光. 机械工程学报. 2017(21)
[4]基于邻域粗糙集的多标记分类特征选择算法[J]. 段洁,胡清华,张灵均,钱宇华,李德玉. 计算机研究与发展. 2015(01)
[5]连铸大方坯内部质量多元模糊模式预测研究[J]. 王宝,张志刚,陈海芳,刘青. 计算机与应用化学. 2012(12)
[6]连铸坯质量判定系统研究综述[J]. 单多,徐安军,汪红兵,田乃媛. 连铸. 2011(02)
硕士论文
[1]基于随机森林算法的铸件内部夹杂类型识别方法研究[D]. 李璐.中北大学 2018
[2]基于神经元网络技术的铸坯质量分析算法研究[D]. 韩舟.大连理工大学 2017
本文编号:2927460
本文链接:https://www.wllwen.com/kejilunwen/jinshugongy/2927460.html
教材专著