林业样地的数据清洗方法研究及其应用
发布时间:2022-12-04 16:00
针对信息时代中遇到的脏数据现象,研究类比分析了林业信息化过程中所存在的数据质量问题以及产生的原因,从统计学和数据挖掘与模式识别的层面介绍了面向异常记录检测和重复记录检测的数据清洗算法,探索了基于分类算法和聚类算法的数据清洗方法在林业样地数据中的应用,验证了数据清洗算法在林业行业的可行性,提出了存在相应的应用瓶颈。
【文章页数】:5 页
【文章目录】:
1 数据质量与林业脏数据
2 数据清洗的定义与算法
2.1 数据清洗的定义
2.2 数据清洗的算法
(1)面向异常记录检测的数据清洗算法。
(2)面向重复记录检测的数据清洗算法。
3 林业样地数据中数据清洗的应用
3.1 采用分类算法的林业样地数据清洗研究
3.2 采用聚类算法的林业样地数据清洗研究
4 结论
【参考文献】:
期刊论文
[1]结构化数据清洗技术综述[J]. 郝爽,李国良,冯建华,王宁. 清华大学学报(自然科学版). 2018(12)
[2]基于关联数据的一致性和时效性清洗方法[J]. 杜岳峰,申德荣,聂铁铮,寇月,于戈. 计算机学报. 2017(01)
[3]基于任务合并的并行大数据清洗过程优化[J]. 杨东华,李宁宁,王宏志,李建中,高宏. 计算机学报. 2016(01)
[4]构建数据仓库过程中的数据清洗研究[J]. 刘喜文,郑昌兴,王文龙,汤刚强. 图书与情报. 2013(05)
[5]数据清洗研究综述[J]. 王曰芬,章成志,张蓓蓓,吴婷婷. 现代图书情报技术. 2007(12)
硕士论文
[1]基于数据挖掘的数据清洗及其评估模型的研究[D]. 邹杰.北京邮电大学 2017
[2]数据质量管理与数据清洗技术的研究与应用[D]. 陈孟婕.北京邮电大学 2013
本文编号:3708565
【文章页数】:5 页
【文章目录】:
1 数据质量与林业脏数据
2 数据清洗的定义与算法
2.1 数据清洗的定义
2.2 数据清洗的算法
(1)面向异常记录检测的数据清洗算法。
(2)面向重复记录检测的数据清洗算法。
3 林业样地数据中数据清洗的应用
3.1 采用分类算法的林业样地数据清洗研究
3.2 采用聚类算法的林业样地数据清洗研究
4 结论
【参考文献】:
期刊论文
[1]结构化数据清洗技术综述[J]. 郝爽,李国良,冯建华,王宁. 清华大学学报(自然科学版). 2018(12)
[2]基于关联数据的一致性和时效性清洗方法[J]. 杜岳峰,申德荣,聂铁铮,寇月,于戈. 计算机学报. 2017(01)
[3]基于任务合并的并行大数据清洗过程优化[J]. 杨东华,李宁宁,王宏志,李建中,高宏. 计算机学报. 2016(01)
[4]构建数据仓库过程中的数据清洗研究[J]. 刘喜文,郑昌兴,王文龙,汤刚强. 图书与情报. 2013(05)
[5]数据清洗研究综述[J]. 王曰芬,章成志,张蓓蓓,吴婷婷. 现代图书情报技术. 2007(12)
硕士论文
[1]基于数据挖掘的数据清洗及其评估模型的研究[D]. 邹杰.北京邮电大学 2017
[2]数据质量管理与数据清洗技术的研究与应用[D]. 陈孟婕.北京邮电大学 2013
本文编号:3708565
本文链接:https://www.wllwen.com/wenshubaike/mfmb/3708565.html