当前位置:主页 > 农业论文 > 园艺论文 >

基于随机森林的苹果内部品质多标签分类方法研究

发布时间:2020-08-18 19:16
【摘要】:作为四大水果之一,苹果在人类日常生活中占据了很重要的地位,我国的苹果产量居世界第一,但出口量只占总产量1.46%,阻碍我国鲜果出口的一个重要因素是苹果的分选、检测能力以及检测速度不能满足市场的需求。随着社会科技的迅速发展,评价苹果的品质已经不再局限于通过颜色、大小等外部指标进行评判,人们越来越关注其营养价值和内部品质,先进的水果分选检测能力需要建立在水果内部品质检测之上,而水果的内部品质由其内部的糖分、含水率等多种理化指标来决定。因此寻求一种检测苹果糖度、硬度、含水率等内部品质的方法对苹果的分级销售和出口具有重大意义。目前大量研究已证明介电特征和水果的内部指标具有非常紧密的关系,而介电特征的测量可以在无损的情况下完成,并依据介电特征推断苹果的理化特征。本研究的主要内容如下:(1)构建基于随机森林的苹果内部品质分类模型。在随机森林分类器的工作原理和基础上,分析了其主要参数的选取和功能。本实验中介电特征有108种,理化特征标签有8种,将理化特征均分为5个等级,共8×5个标签信息。将500个苹果均分成10个子集,将10个子集中的一个作为测试集,而其余的9个作为训练集,采用十折交叉验证的方法训练出多棵决策树构成随机森林。训练结果表明随机森林分类器能够有效地处理苹果内部品质多标签分类问题,且森林规模越大,分类准确率越高,使用信息增益目标函数的随机森林与其他随机森林相比具有较好分类性能。与SVM算法进行对比,随机森林有较好的分类准确性。(2)选取随机森林的输出类别。不同于传统的决策树方法,本实验对待随机森林作为一个整体,使融合信息单独包含在每个叶子节点,每个叶节点对应一个苹果,将苹果用理化特征标注标签并预测。在类别选取时,采用TF-IDF算法传回随机森林的输出类别。实验结果表明,基于TF-IDF方法传回的随机森林输出类别可以将介电特征和相关的理化特征有效关联。(3)对随机森林的输出类别排序。本研究中苹果理化特征中的8个指标分别被预分为5个等级。由于随机森林的每棵决策树都是独立的,在选取输出类别时计算标注苹果的标签概率后,对输出类别的个数进行排序,系统地分配苹果最佳标签标记苹果的理化特征。本实验中,使用Rank SVM算法进行排序,将3种框架模型应用于Rank SVM中,分别是f(ci)=ci,f(ci)=ci2以及f(ci)为本研究中提出的系统选取f(ci)的框架模型。实验结果表明,f(ci)通过系统的选取对苹果品质分类效果较好,在分类预测中标签级别分布较为一致,均方根误差为0.51。
【学位授予单位】:西北农林科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:S661.1;TP391.41
【图文】:

外观,苹果,品质,理化指标


就要求对水果的理化指标进行分析,从而进行多标签分类。多标签分类多用于图像的类,所以本研究基于无损检测的基础上,借鉴图像多标签标注算法,提出一种基于随森林的苹果内部口感品质多语义分类方法。使用苹果的介电参数作为指导生成随机森,用 TF-IDF 算法选取输出类别,并对输出类别进行排序,依据介电参数估计预测苹的理化指标。为水果等农产品的无损检测、分级提供参考。依靠介电特性推断表示苹的理化指标,对苹果内部品质进行多标签分类研究。

序列,介电特征,测量系统,介电参数


一共选取了 12 种介电参数进行研究,每种介电参数在 158Hz~3.98MH率范围内共 9 个频率点(i=158Hz~3980000Hz)下得到 9 种介电特征。最终得到 9共 108 种介电特征,分别使用从 1 到 108 对介电特征进行编号,其详细介绍见表 3表中符号标志列中字母下标代表频率点,参与测量的苹果果实为 500 个。表 3-1 12 种介电参数以及 108 种介电特征说明Table 3-1 Illustration of 12 dielectric parameters and 108 dielectric features序列 编号 介电特征名称 单位 符号标志1 1~9 复阻抗 欧姆( ) Zi2 10~18 串联电容 法拉(F) Csi3 19~27 串联电感 亨利(H) Lsi4 27~36 串联电阻 欧姆( ) Rsi5 37~45 并联电容 法拉(F) Cpi6 45~54 并联电感 亨利(H) Lpi7 55~63 电导 西门子(S) Gi

森林,算法流程图,随机抽样,构建过程


图 4-1 随机森林算法流程图Fig. 4-1 flow chart of random forest algorithm4.1.2 随机森林参数的选择与设置在如上进行随机森林构建过程中,较为重要的参数选取与设置如下(1)训练集随机抽样选取。随机森林构建过程中,每棵树使用不同些子集从所有苹果参数训练数据集中随机抽样得到。本研究中,选取袋法来进行抽样,袋装方法可以避免过拟合并且能够提高森林的泛化性能

【参考文献】

相关期刊论文 前10条

1 蔡骋;李永超;马惠玲;李晓龙;;基于介电特征选择的苹果内部品质无损分级[J];农业工程学报;2013年21期

2 蔡骋;李晓龙;马惠玲;任小林;黄良妹;曾燕春;;基于生物阻抗特性的苹果新鲜度无损测定[J];农业机械学报;2013年02期

3 安慧珍;马惠玲;任小林;;苹果果实贮藏期间电学参数与品质指标的关系[J];食品科学;2013年02期

4 岳绒;郭文川;刘卉;;近红外漫反射光谱检测损伤猕猴桃的内部品质[J];食品科学;2011年10期

5 刘端阳;邱卫杰;;基于加权SVM主动学习的多标签分类[J];计算机工程;2011年08期

6 刘端阳;邱卫杰;;基于SVM期望间隔的多标签分类的主动学习[J];计算机科学;2011年04期

7 方匡南;吴见彬;朱建平;谢邦昌;;随机森林方法研究综述[J];统计与信息论坛;2011年03期

8 张亚静;Sakae Shibusawa;李民赞;;基于机器视觉的番茄内部品质预测[J];农业工程学报;2010年S2期

9 史波林;赵镭;刘文;汪厚银;朱大洲;尹京苑;;苹果内部品质近红外光谱检测的异常样本分析[J];农业机械学报;2010年02期

10 郭立力;赵春江;;十折交叉检验的支持向量机参数优化算法[J];计算机工程与应用;2009年08期

相关硕士学位论文 前4条

1 张菲;中国水果出口至东盟的影响因素和潜力分析[D];南京农业大学;2011年

2 林如泉;水果出口跨越技术性贸易壁垒的对策研究[D];华中农业大学;2007年

3 楼军文;中国水果进出口检验检疫技术性贸易措施研究[D];中国农业大学;2005年

4 宋金亚;基于介电特性和灰色理论的苹果内部品质无损检测方法研究[D];浙江工业大学;2004年



本文编号:2796610

资料下载
论文发表

本文链接:https://www.wllwen.com/nykjlw/yylw/2796610.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户22e01***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com