基于RS-SVM模型的精准扶贫绩效研究
发布时间:2021-07-15 17:49
在当前精准扶贫实施背景下,如何科学有效地对扶贫绩效评价是一个值得探究的问题,一方面能够综合评价工作成效,另一方面为摘帽贫困县的可持续发展起着推动作用。本文通过整理文献和现阶段研究成果,发现目前学者们对于扶贫绩效的研究,已经有了较为丰富的成果,有许多精髓之处值得我们借鉴,但也存在一些不足,如在评价方法选择上,常用的层次分析法等,往往需依据专家的经验赋值,主观性较强。因子分析法较客观,但若数据对KMO检验不通过,则因子分析表现出不适用性,且综合因子的实际含义难以精确定义。本文提出一种扶贫绩效评价方法,将粗糙集作为支持向量机建模的前置系统,两者结合应用于精准扶贫绩效评价中。在理论研究的基础上,分析了二者的优势互补性,并详细说明模型的构建步骤。结合山西省23个贫困县做实证分析,首先从经济效益、社会效益、生态效益和反贫困四个层次,确定了十四个指标构建指标体系;再运用粗糙集理论对初始决策表的指标属性进行约简,基于属性重要度计算出各个属性的重要度,约简不重要的指标并得到相应的权重,综合评价得分,构建新的决策表;然后对新的决策表建立支持向量机模型,在参数寻优过程中,采用了网格搜索法、遗传算法和粒子群算...
【文章来源】:山西大学山西省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
粗糙集概念示意图
P汀;痪浠八凳侵附??澳?力与得到模型的复杂度建立在泛化能力强的基础上。相比于只有在样本量接近无穷大时才能得到较好的预测能力的传统学习方法,支持向量机适用于对有限的样本的统计研究。支持向量机比传统的统计学习方法更有优势,即使是非线性问题仍有强大的学习能力,能在有限样本范围内避免维数灾难,又能避免局部极小的情况。最初的支持向量机是一种分类学习机,支持向量分类机(SVC)[36]用来解决两分类问题。为了使分类器对于新的样本点的泛化能力尽可能的好,支持向量机提出使两种分类之间的间隔距离最远。如下图2.2所示,包含了两个不同类的样本点,将三角和圆圈分别记为1和-1,记三角所在直线为L1:bxw1T;圆圈所在直线记作L2:bxw1T;L1与L2之间的线记L0:bxw0T,这就是分类超平面。L1与L2是超平面的两条上下边缘线。图2.2支持向量机分类L1与L2之间的距离,称为间隔距离,要求出最大间隔距离,常将其替换为求min。显然,当w=0时为最小,这意味着两条直线L1与L2距离无穷大,那么样本点1和-1不但没有被间隔开,反而聚集到了L1与L2之间,所以要同时满足前提条件:bxw1iT和bxw1iT;于是有:2,21minwbw,ts..bxwy1)(iTi,i=1,2,…,p(2.3)引入拉格朗日乘子ai构造拉格朗日函数,得到无约束优化问题并对其求解。最优解满足bxwya0)1))(((iTiipi,支持向量就是那些ai不为零对应的样本点xi,并且落在L1或L2边界线上。由此可以得出最大化目标函数继而得到决策函数为:))(sgn())sgn(()(*1**bxxyabxwxfiipiiT(2.4)以上对支持向量机的讨论是基于线性可分类情况的。当样本数据的线性却存在不可分的异常点时,要使分类间隔和错分的误差都小,引入松弛变量0i,样本数
基于RS-SVM模型的精准扶贫绩效研究12据的经验风险用i反映,在结构风险最小化的基础上,又引入惩罚参数C用来平衡最大间隔和最小错分类误差,得到分类器新优化软间隔问题式(2.5),由此可知线性分类问题中,线性可分与线性不可分问题约束条件有差别。piiCw12)2/min(s.t.iiTibxwy1])[(,0i,i=1,…,p(2.5)对于非线性分类问题,通常采用合适的非线性变换解决问题。支持向量机选择核函数作为映射函数,将原始输入空间中的向量x,映射到高维特征空间中训练,这样就变成了简单的线性问题,如图2.3所示。核函数的选择与要研究的问题和样本数据相关,选择不同,实验效果不同。选定核函数后,把内积xi*xj的值用核函数k(xi,xj)的值来代替,于是最终对应的分类函数为:)),(sgn()(*1*bxxkyaxfiipii(2.6)图2.3核函数映射支持向量回归[36](SVR)解决回归预测问题就是由支持向量分类演化而来,由分类最大间隔我们可以想到,当所有样本点都落在边界线L1与L2之间时,就近似为线性回归问题,如图2.4:图2.4支持向量回归机在训练样本中,不是所有的样本点都能落到边界线上,存在损失,设定0,为f(x)与y之间允许的最大损失,也就是与超平面间隔的最大距离,当)(yxf时,才会计算学习器整体的误差损失,因此定义一个损失函数。为减小异常点带
【参考文献】:
期刊论文
[1]精准扶贫绩效提升的现实困境[J]. 吕华. 内蒙古科技与经济. 2019(23)
[2]精准扶贫的绩效评估研究[J]. 张敏. 时代金融. 2019(33)
[3]后精准扶贫阶段农村精准扶贫综合绩效提升研究——基于4省38市数据的实证分析[J]. 陈弘,周贤君,胡扬名. 中国行政管理. 2019(11)
[4]基于GIS的武陵山区旅游扶贫绩效空间差异分析——以湖南省37个县市为例[J]. 唐业喜,周盛芳,李智辉,李逸舒,陈其红,邓明蓉. 湖北农业科学. 2019(20)
[5]精准扶贫绩效评价指标体系构建及实证——以全国重点扶贫地区为例[J]. 陈升,张雯雯,何增华. 武汉交通职业学院学报. 2019(03)
[6]基于大数据挖掘的精准扶贫工作第三方评估——以武汉市为例[J]. 李红艳,汪涛. 武汉工程职业技术学院学报. 2019(03)
[7]全过程视域下精准扶贫绩效评价体系构建[J]. 李社宁,张哲,李喜宁. 地方财政研究. 2019(08)
[8]精准扶贫绩效评价模型及应用[J]. 刘丹,郑喜喜,杨悦. 统计与决策. 2019(09)
[9]精准扶贫的过程与绩效探讨[J]. 余兵皓,吴明凯. 广西质量监督导报. 2019(02)
[10]精准扶贫绩效评价研究综述[J]. 程诗祺,裴潇. 农村经济与科技. 2018(22)
硕士论文
[1]基于因子分析和数据包络法的河北省精准扶贫绩效评估研究[D]. 王玉娜.河北大学 2019
[2]精准扶贫的绩效评价及影响因素研究[D]. 王璇.电子科技大学 2019
[3]我国农村扶贫绩效评价与实证分析[D]. 刘倩倩.青岛大学 2017
本文编号:3286178
【文章来源】:山西大学山西省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
粗糙集概念示意图
P汀;痪浠八凳侵附??澳?力与得到模型的复杂度建立在泛化能力强的基础上。相比于只有在样本量接近无穷大时才能得到较好的预测能力的传统学习方法,支持向量机适用于对有限的样本的统计研究。支持向量机比传统的统计学习方法更有优势,即使是非线性问题仍有强大的学习能力,能在有限样本范围内避免维数灾难,又能避免局部极小的情况。最初的支持向量机是一种分类学习机,支持向量分类机(SVC)[36]用来解决两分类问题。为了使分类器对于新的样本点的泛化能力尽可能的好,支持向量机提出使两种分类之间的间隔距离最远。如下图2.2所示,包含了两个不同类的样本点,将三角和圆圈分别记为1和-1,记三角所在直线为L1:bxw1T;圆圈所在直线记作L2:bxw1T;L1与L2之间的线记L0:bxw0T,这就是分类超平面。L1与L2是超平面的两条上下边缘线。图2.2支持向量机分类L1与L2之间的距离,称为间隔距离,要求出最大间隔距离,常将其替换为求min。显然,当w=0时为最小,这意味着两条直线L1与L2距离无穷大,那么样本点1和-1不但没有被间隔开,反而聚集到了L1与L2之间,所以要同时满足前提条件:bxw1iT和bxw1iT;于是有:2,21minwbw,ts..bxwy1)(iTi,i=1,2,…,p(2.3)引入拉格朗日乘子ai构造拉格朗日函数,得到无约束优化问题并对其求解。最优解满足bxwya0)1))(((iTiipi,支持向量就是那些ai不为零对应的样本点xi,并且落在L1或L2边界线上。由此可以得出最大化目标函数继而得到决策函数为:))(sgn())sgn(()(*1**bxxyabxwxfiipiiT(2.4)以上对支持向量机的讨论是基于线性可分类情况的。当样本数据的线性却存在不可分的异常点时,要使分类间隔和错分的误差都小,引入松弛变量0i,样本数
基于RS-SVM模型的精准扶贫绩效研究12据的经验风险用i反映,在结构风险最小化的基础上,又引入惩罚参数C用来平衡最大间隔和最小错分类误差,得到分类器新优化软间隔问题式(2.5),由此可知线性分类问题中,线性可分与线性不可分问题约束条件有差别。piiCw12)2/min(s.t.iiTibxwy1])[(,0i,i=1,…,p(2.5)对于非线性分类问题,通常采用合适的非线性变换解决问题。支持向量机选择核函数作为映射函数,将原始输入空间中的向量x,映射到高维特征空间中训练,这样就变成了简单的线性问题,如图2.3所示。核函数的选择与要研究的问题和样本数据相关,选择不同,实验效果不同。选定核函数后,把内积xi*xj的值用核函数k(xi,xj)的值来代替,于是最终对应的分类函数为:)),(sgn()(*1*bxxkyaxfiipii(2.6)图2.3核函数映射支持向量回归[36](SVR)解决回归预测问题就是由支持向量分类演化而来,由分类最大间隔我们可以想到,当所有样本点都落在边界线L1与L2之间时,就近似为线性回归问题,如图2.4:图2.4支持向量回归机在训练样本中,不是所有的样本点都能落到边界线上,存在损失,设定0,为f(x)与y之间允许的最大损失,也就是与超平面间隔的最大距离,当)(yxf时,才会计算学习器整体的误差损失,因此定义一个损失函数。为减小异常点带
【参考文献】:
期刊论文
[1]精准扶贫绩效提升的现实困境[J]. 吕华. 内蒙古科技与经济. 2019(23)
[2]精准扶贫的绩效评估研究[J]. 张敏. 时代金融. 2019(33)
[3]后精准扶贫阶段农村精准扶贫综合绩效提升研究——基于4省38市数据的实证分析[J]. 陈弘,周贤君,胡扬名. 中国行政管理. 2019(11)
[4]基于GIS的武陵山区旅游扶贫绩效空间差异分析——以湖南省37个县市为例[J]. 唐业喜,周盛芳,李智辉,李逸舒,陈其红,邓明蓉. 湖北农业科学. 2019(20)
[5]精准扶贫绩效评价指标体系构建及实证——以全国重点扶贫地区为例[J]. 陈升,张雯雯,何增华. 武汉交通职业学院学报. 2019(03)
[6]基于大数据挖掘的精准扶贫工作第三方评估——以武汉市为例[J]. 李红艳,汪涛. 武汉工程职业技术学院学报. 2019(03)
[7]全过程视域下精准扶贫绩效评价体系构建[J]. 李社宁,张哲,李喜宁. 地方财政研究. 2019(08)
[8]精准扶贫绩效评价模型及应用[J]. 刘丹,郑喜喜,杨悦. 统计与决策. 2019(09)
[9]精准扶贫的过程与绩效探讨[J]. 余兵皓,吴明凯. 广西质量监督导报. 2019(02)
[10]精准扶贫绩效评价研究综述[J]. 程诗祺,裴潇. 农村经济与科技. 2018(22)
硕士论文
[1]基于因子分析和数据包络法的河北省精准扶贫绩效评估研究[D]. 王玉娜.河北大学 2019
[2]精准扶贫的绩效评价及影响因素研究[D]. 王璇.电子科技大学 2019
[3]我国农村扶贫绩效评价与实证分析[D]. 刘倩倩.青岛大学 2017
本文编号:3286178
本文链接:https://www.wllwen.com/shoufeilunwen/jjglss/3286178.html