数据挖掘在精准帮扶数据分析中的应用研究
发布时间:2022-05-08 19:16
精准扶贫是指针对不同贫困区域环境、不同贫困农户状况,运用科学有效程序对扶贫对象实施精确识别、精确帮扶、精确管理的治贫方式。目前的精准扶贫工作中,贫困户识别和帮扶措施匹配主要是通过驻村干部遍访和建档立卡,但是全中国有6亿多农村人口,传统方法费时费力且不易管理,迫切需要引入新技术、新手段完成区域内贫困户和帮扶措施的智能识别,降低人力成本和人为因素干扰,使扶贫工作智能化、透明化。本文将数据挖掘技术引入到精准扶贫工作中,通过一系列数据处理分析方案,辅助扶贫工作完成贫困户贫困特征的智能识别,为精准匹配帮扶措施打下基础。首先,数据准备阶段,包括数据指标体系的建立和数据的前期处理。通过对扶贫问题、政策、方案的深入研究,初步分析建档立卡、遍访数据等内部数据以及卫计、民政、教育、财政等部门数据和互联网数据,综合考虑专家意见,建立精准帮扶数据指标体系,便于对数据进行科学有效的存储、管理,服务于进一步的数据分析工作。然后,本文设计了数据标准化方案、指标清洗方案,完成扶贫数据的预处理工作,为后期的数据分析完成数据准备。然后,数据挖掘阶段,本文通过DBSCAN聚类算法来挖掘贫困户的贫困特征,完成贫困户贫困特征的...
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景和意义
1.2 研究现状
1.2.1 精准帮扶研究现状
1.2.2 数据挖掘研究现状
1.3 论文主要内容与组织结构
1.3.1 主要研究内容
1.3.2 本文的组织结构
第2章 数据挖掘
2.1 数据挖掘的定义
2.2 数据挖掘的过程
2.2.1 数据准备
2.2.2 数据挖掘
2.2.3 结果解释和评价
2.3 数据挖掘算法
2.3.1 聚类算法
2.3.2 分类算法
2.3.3 关联性分析算法
2.3.4 遗传算法
2.4 本章小结
第3章 精准帮扶数据前期处理
3.1 精准帮扶数据指标体系
3.2 数据分类技术
3.3 数据标准化方案
3.4 数据指标清洗方案
3.5 本章小结
第4章 DBSCAN算法及其改进策略
4.1 DBSCAN算法
4.1.1 算法原理
4.1.2 DBSCAN在高维数据集中的局限
4.1.3 DBSCAN在大规模数据集中的局限
4.2 基于局部敏感哈希的DBSCAN算法改进策略
4.2.1 局部敏感哈希算法
4.2.2 基于K近邻的二进制数据表示
4.3 基于二进制影响空间和种子点的DBSCAN算法改进策略
4.3.1 基于二进制数据集的影响空间
4.3.2 种子点选取策略
4.4 算法步骤
4.5 实验评估与分析
4.5.1 查询时间对比
4.5.2 聚类质量对比
4.5.3 实际数据集中算法性能验证
4.6 本章小结
第5章 改进DBSCAN算法在贫困特征智能识别中的应用
5.1 扶贫数据前期处理
5.2 聚类挖掘与分析
5.3 区域结果分析与展示
第6章 总结与展望
6.1 全文总结
6.2 未来展望
参考文献
致谢
附录
图版
【参考文献】:
期刊论文
[1]特征聚类在油田测试方案优化中的研究[J]. 李洪奇,张艳丽,杨景海,朱丽萍,赵艳红,裴建亚. 计算机工程与应用. 2017(21)
[2]基于主成分和聚类分析的曲拉品质的综合评价[J]. 陈梦音,王琳琳,韩玲,丁考仁青,张佳莹,黄彩燕,文鹏程. 食品科学. 2017(13)
[3]基于LSH的高维大数据k近邻搜索算法[J]. 王忠伟,陈叶芳,钱江波,陈华辉. 电子学报. 2016(04)
[4]一种基于近邻表示的聚类方法[J]. 周国兵,吴建鑫,周嵩. 软件学报. 2015(11)
[5]我国精准扶贫工作机制问题探析[J]. 王国勇,邢溦. 农村经济. 2015(09)
[6]结合降维技术的电力负荷曲线集成聚类算法[J]. 张斌,庄池杰,胡军,陈水明,张明明,王科,曾嵘. 中国电机工程学报. 2015(15)
[7]精准扶贫的难点、对策与路径选择[J]. 邓维杰. 农村经济. 2014(06)
[8]农村扶贫开发动态评价指标体系构建研究——以兰州市为例[J]. 张小鸋,付英,马燕玲. 浙江农业学报. 2014(01)
[9]中国西部地区生态扶贫策略研究[J]. 刘慧,叶尔肯·吾扎提. 中国人口.资源与环境. 2013(10)
[10]基于流形学习的局部保持PCA算法在故障检测中的应用[J]. 王健,冯健,韩志艳. 控制与决策. 2013(05)
博士论文
[1]聚类分析及其应用研究[D]. 唐东明.电子科技大学 2010
[2]高维数据的聚类方法研究与应用[D]. 陈黎飞.厦门大学 2008
本文编号:3652224
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景和意义
1.2 研究现状
1.2.1 精准帮扶研究现状
1.2.2 数据挖掘研究现状
1.3 论文主要内容与组织结构
1.3.1 主要研究内容
1.3.2 本文的组织结构
第2章 数据挖掘
2.1 数据挖掘的定义
2.2 数据挖掘的过程
2.2.1 数据准备
2.2.2 数据挖掘
2.2.3 结果解释和评价
2.3 数据挖掘算法
2.3.1 聚类算法
2.3.2 分类算法
2.3.3 关联性分析算法
2.3.4 遗传算法
2.4 本章小结
第3章 精准帮扶数据前期处理
3.1 精准帮扶数据指标体系
3.2 数据分类技术
3.3 数据标准化方案
3.4 数据指标清洗方案
3.5 本章小结
第4章 DBSCAN算法及其改进策略
4.1 DBSCAN算法
4.1.1 算法原理
4.1.2 DBSCAN在高维数据集中的局限
4.1.3 DBSCAN在大规模数据集中的局限
4.2 基于局部敏感哈希的DBSCAN算法改进策略
4.2.1 局部敏感哈希算法
4.2.2 基于K近邻的二进制数据表示
4.3 基于二进制影响空间和种子点的DBSCAN算法改进策略
4.3.1 基于二进制数据集的影响空间
4.3.2 种子点选取策略
4.4 算法步骤
4.5 实验评估与分析
4.5.1 查询时间对比
4.5.2 聚类质量对比
4.5.3 实际数据集中算法性能验证
4.6 本章小结
第5章 改进DBSCAN算法在贫困特征智能识别中的应用
5.1 扶贫数据前期处理
5.2 聚类挖掘与分析
5.3 区域结果分析与展示
第6章 总结与展望
6.1 全文总结
6.2 未来展望
参考文献
致谢
附录
图版
【参考文献】:
期刊论文
[1]特征聚类在油田测试方案优化中的研究[J]. 李洪奇,张艳丽,杨景海,朱丽萍,赵艳红,裴建亚. 计算机工程与应用. 2017(21)
[2]基于主成分和聚类分析的曲拉品质的综合评价[J]. 陈梦音,王琳琳,韩玲,丁考仁青,张佳莹,黄彩燕,文鹏程. 食品科学. 2017(13)
[3]基于LSH的高维大数据k近邻搜索算法[J]. 王忠伟,陈叶芳,钱江波,陈华辉. 电子学报. 2016(04)
[4]一种基于近邻表示的聚类方法[J]. 周国兵,吴建鑫,周嵩. 软件学报. 2015(11)
[5]我国精准扶贫工作机制问题探析[J]. 王国勇,邢溦. 农村经济. 2015(09)
[6]结合降维技术的电力负荷曲线集成聚类算法[J]. 张斌,庄池杰,胡军,陈水明,张明明,王科,曾嵘. 中国电机工程学报. 2015(15)
[7]精准扶贫的难点、对策与路径选择[J]. 邓维杰. 农村经济. 2014(06)
[8]农村扶贫开发动态评价指标体系构建研究——以兰州市为例[J]. 张小鸋,付英,马燕玲. 浙江农业学报. 2014(01)
[9]中国西部地区生态扶贫策略研究[J]. 刘慧,叶尔肯·吾扎提. 中国人口.资源与环境. 2013(10)
[10]基于流形学习的局部保持PCA算法在故障检测中的应用[J]. 王健,冯健,韩志艳. 控制与决策. 2013(05)
博士论文
[1]聚类分析及其应用研究[D]. 唐东明.电子科技大学 2010
[2]高维数据的聚类方法研究与应用[D]. 陈黎飞.厦门大学 2008
本文编号:3652224
本文链接:https://www.wllwen.com/jingjilunwen/nongyejingjilunwen/3652224.html