当前位置:主页 > 理工论文 > 自然地理论文 >

基于数据挖掘技术的土壤属性数据处理研究

发布时间:2024-03-07 20:08
  传统土壤属性数据处理一般是以具体应用为导向,对单一行业及小规模数据进行处理,忽略数据本身的数学特征,存在数据处理过程繁琐、分析受专业限制、数据跨行业不共享等问题。数据挖掘技术则是基于数据本身数学特征,忽略数据本身的专业意义去探索、发现其内在价值的数据处理技术。本研究系统性地引入数据挖掘技术处理土壤属性数据,并将其处理方法与传统的土壤学方法进行比对以探索其关联性,可为传统土壤数据处理打通一条进行大规模数据处理、跨行业数据共享通道,为土壤学数据处理方法的改进及与大数据时代接轨提供理论依据。本研究的研究目标主要是通过对基于数据挖掘技术与基于传统土壤学数据处理方法的比对,探索两种方法所存在的关联关系。以广东省74个县市区176种土壤剖面样本为数据来源,开展数据挖掘技术在土壤属性数据处理方面应用研究,并得出以下研究结果:(1)构建了基于数据挖掘算法的土壤属性数据分析与处理模型,包括聚类法、ID3决策树法、灰色关联系数法、数据挖掘可视化展示工具法等。利用数据挖掘技术对土壤属性元数据进行清洗、整理、转换,将部分重复数据、空数据、明显不合理偏离值脏数据进行删除或修正处理,最终确定797条最终数据作为本...

【文章页数】:137 页

【学位级别】:博士

【部分图文】:

图1.1技术路线图

图1.1技术路线图


图2.1土壤属性数据挖掘分析流程图

图2.1土壤属性数据挖掘分析流程图

为土壤属性数据处理提供一个便捷的、普遍适用的数据处理流程与方法的集合。模型构建的意义在于:(1)围绕土壤属性数据,集中、充分发掘数据多方面的潜在价值。(2)灵活集成各种土壤属性数据处理的技术、方法。(3)便于针对土壤属性数据处理,开发出相关的信息应用系统。(4)便于土壤属性数据处....


图2.3用Tableau软件绘制的展示有机碳含量盒须图示例

图2.3用Tableau软件绘制的展示有机碳含量盒须图示例

函数输出结果,densino(容重)的缺失率超过50%,hx酸)缺失值超过15%,通过追查原因可知容重及交换性抽样进行,因此出现缺失值。或差错)异常值发现与分析盒须图来发现数据中的异常值。根据盒须图发现异常0),本研究异常值定义为小于QL-1.5IQR或大于QU+1.5....


图2.4以地域为维度某属性数据分布直方图

图2.4以地域为维度某属性数据分布直方图

根据数据核实,这些离散值均为严格测量值,可归为土壤属性脏数据,因此予以保留。该法可用于大量的数据筛选及寻找并定位异常数据特征分析行数据特征分析对整体土壤属性数据挖掘及是否能获得预期结果有着义。利用tableau绘制出可视化图表,可用于辅助进行数据特征分析。特征分析主要包括以....



本文编号:3921659

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/zrdllw/3921659.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9834e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com