当前位置:主页 > 经济论文 > 经济管理论文 >

基于损失函数的抽样方法比较研究

发布时间:2020-12-30 03:46
  随着数据集种类的复杂化,涌现出来多种不同于传统的抽样方法。因此评价不同的抽样方法显得尤为重要,但是目前大多数文献都是对抽样估计量的稳健性进行评价,该方法得到的估计量只能使得估计量与真值的差异保持稳定,至于该估计量带来的精确的损失值是不得而知的,只能在日常生产中进行经验积累,是否存在一个估计量会使得损失值减少也是不得而知的。本篇文章引入损失函数来评价不同的抽样方法,将损失函数最小化设定为目标函数,根据已有的样本信息,得到新的估计量。在使用损失函数评价抽样方法的过程中,逐步放宽假设使得该方法在实际生产中也能进行应用。首先假设总体分布是已知的包括分布中的参数,这样可以精确的计算出估计量与真实值之间的损失;但是在实际生产中是不可能得到总体分布的参数值的,因此将假设放宽到总体分布已知但是参数未知的情况;最后则为了提高估计量的精度通过多次抽样计算平均损失,来衡量该估计量的保守性。根据目前抽样方法的分类选取了等概率抽样,不等概率抽样,非概率抽样和机器抽样。同时选取了常用的四类损失函数,包括:绝对值损失函数,平方损失函数,逆正态损失函数和逆Gamma损失函数。采用以上损失函数来衡量估计量带来的损失值,... 

【文章来源】:山西财经大学山西省

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

基于损失函数的抽样方法比较研究


积分损失函数

密度图,样本量,密度,样本分布


山西财经大学硕士学位论文不等概率抽样外,其余的样本分布全部位于总体分布下方的,基本上样本分布与总体分布重合,也就是说各类方法的信息损失全部集中表现在分布的顶部。整体上看简单随机抽样的概率密度与总体概率密度相近,重合面积较大;当样本量为 210 时,PaiPS 抽样的概率密度函数与总体概率密度相差较大,因此重合面积是相对于其他两种抽样方法中最小的;此外随着样本量的增加,重合面积也逐渐增加,在样本量为 1500 时,样本分布和总体的概率密度基本重合,配额抽样的重合面积相对而言较小。图 4.5 为自助法在概率抽样下的样本分布,由于刀切法是在原有样本下轮流剔除一个样本计算均值,因此其样本分布应与原始样本相同,在这里不重复作图。

密度图,样本量,密度,样本分布


山西财经大学硕士学位论文不等概率抽样外,其余的样本分布全部位于总体分布下方的,基本上样本分布与总体分布重合,也就是说各类方法的信息损失全部集中表现在分布的顶部。整体上看简单随机抽样的概率密度与总体概率密度相近,重合面积较大;当样本量为 210 时,PaiPS 抽样的概率密度函数与总体概率密度相差较大,因此重合面积是相对于其他两种抽样方法中最小的;此外随着样本量的增加,重合面积也逐渐增加,在样本量为 1500 时,样本分布和总体的概率密度基本重合,配额抽样的重合面积相对而言较小。图 4.5 为自助法在概率抽样下的样本分布,由于刀切法是在原有样本下轮流剔除一个样本计算均值,因此其样本分布应与原始样本相同,在这里不重复作图。

【参考文献】:
期刊论文
[1]Mlinex损失函数下艾拉姆咖分布的Bayes估计[J]. 范梓淼,周菊玲.  统计与决策. 2017(07)
[2]逆指数分布参数估计的损失函数和风险函数的Bayes推断[J]. 阳连武.  宜春学院学报. 2016(12)
[3]住户调查中户内样本抽样方法的比较研究[J]. 吕萍.  数理统计与管理. 2016(01)
[4]基于指数损失函数的参数设计[J]. 文平,贾达明.  常州工学院学报. 2015(Z1)
[5]有辅助信息下总体均值的一类新比估计量[J]. 薛雨霞,闫在在.  内蒙古工业大学学报(自然科学版). 2015(01)
[6]连续性抽样调查中总体均值的估计[J]. 高莉菁.  统计与决策. 2015(01)
[7]比估计方法下Eichhorn and Hayre模型的参数估计[J]. 刘媛媛,吕雄,白树叶,曹学勤,李树华.  内蒙古师范大学学报(自然科学汉文版). 2014(06)
[8]在线社交媒体数据抽样方法的比较研究[J]. 崔颖安,李雪,王志晓,张德运.  计算机学报. 2014(08)
[9]PPS和简单随机抽样估计效率的实证检验[J]. 周庆元.  统计与决策. 2014(01)
[10]非抽样误差视角下普查涵盖误差及其模型研究[J]. 陶然.  统计研究. 2012(12)

博士论文
[1]复杂数据的统计推断:时间序列、抽样和函数型数据[D]. 王江艳.苏州大学 2016

硕士论文
[1]机器学习中损失函数问题研究[D]. 苏美红.西北大学 2015
[2]在半参数密度函数比模型下关于两总体均值差检验的研究[D]. 方芳.南京财经大学 2014
[3]Jackknife估计与Bootstrap估计的理论与应用[D]. 王娟.扬州大学 2007
[4]几类分布的参数估计的损失函数和风险函数的Bayes推断[D]. 桑红芳.中南大学 2006



本文编号:2946922

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/2946922.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6b2ff***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com