基于关联规则的耕地质量评价数据检错方法研究——以广州市为例
发布时间:2024-06-19 09:57
研究目的:从数据项之间关联关系的角度切入,探索一种新的耕地数据质量检错方法,以期更有效地提高耕地数据库的质量。研究方法:通过数据挖掘算法寻找耕地数据库中的关联关系,计算这些关联关系的发生频率,从中提取低频发生的关联关系作为检测规则(关联规则),最后利用这些关联规则识别耕地数据库中的错误记录(包含或符合关联规则的耕地数据记录为错误记录)。研究结果:(1)该方法有能力识别耕地数据库中的错误,可以做到有效提高耕地参评数据库的正确性;(2)经计算,与耕地领域现有的传统数据检错方法相比,同等条件下该方法可将检错效率提高11倍,甚至更多;(3)该方法可以针对不同的数据库迅速挖掘关联规则,灵活地应对不同的耕地数据库和层出不穷的错误类型。研究结论:基于关联规则的耕地数据库质量检测方法高效、便捷,为耕地领域现有的数据检错方法开辟了一个新的角度和思路,可以在地学领域广泛应用。
【文章页数】:9 页
【部分图文】:
本文编号:3995213
【文章页数】:9 页
【部分图文】:
图1FP-Tree的构建过程及结果
如此,专家只需检测这些低频关联,相比检测整个数据库,低频关联的数据量小,会大大节省工作时间,能有效提高耕地数据库的质量检测的效率。3案例分析
图2FP-Tree
为了进一步验证基于关联规则的耕地数据库质量检测方法的有效性,本文设计两种方法来检测2015年广州市耕地数据库。方式一是直接利用方法中生成的低频关联去寻找那些包含低频关联的记录,并将这些记录作为疑似错误记录,然后再由人工判断它们是否确实是错误记录。方式二是先检查低频关联,再利用专家....
本文编号:3995213
本文链接:https://www.wllwen.com/jingjilunwen/nongyejingjilunwen/3995213.html
上一篇:2020年上半年我国蔬菜生产形势分析
下一篇:没有了
下一篇:没有了