移动众包系统数据质量控制机制的研究与设计
发布时间:2021-02-28 09:14
移动众包作为一种经济高效的工作模式,通过利用人类智慧或人群感知解决时间和空间敏感的众包任务。但是由于众包工人的能力异构性和策略行为使得移动众包的数据质量难以保证。因此质量控制对于移动众包系统来说是必要的,任务分配机制和激励机制通过影响众包工人行为进而影响着数据质量,是目前研究的巨大挑战。论文的主要贡献在于以下三点:(1)调研了移动众包系统中数据质量控制机制的国内外研究现状,从众包工人、任务发布者和众包平台角度分析了移动众包系统中影响数据质量的因素;对现有移动众包系统的质量控制方案进行总结和归纳,划分成四种质量控制策略:改进任务设计、工人选择、激励机制和数据处理;并对具有代表性的质量控制技术进行了阐述和分析。最后指出了现有研究工作的不足之处和将来的研究方向。(2)基于时间和空间限制的空间众包已成为一种新的移动众包模式。如何将动态出现在平台上的众包工人和任务即时地进行合理匹配且最大化匹配对总效用是一个难题。为了解决该问题,本文提出了 TGOA-ExtendedAT算法,该算法先根据工人和任务到达平台的顺序将其分成前后等长两部分,对于前半部分采用贪婪策略即对于每一个到达平台的工人(或任务)为...
【文章来源】:南京邮电大学江苏省
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
改变任务数量
南京邮电大学硕士研究生学位论文第四章基于两阶段的自适应阈值任务分配算法设计41本文提出的TGOA-EAT算法和EAT算法运行时间接近0,而TGOA-GR算法的运行时间随着任务数量的增大不断增大,且最大为18;这是因为TGOA-EAT和EAT算法采取随机化策略而TGOA-GR花费了较长时间获取一个最佳伪分配。在空间损耗上,三种算法的占用空间都随任务数量增大而增加。TGOA-EAT算法和EAT算法的空间损耗要大于TGOA-GR算法,这是因为自适应阈值算法需要记录每个阈值运行历史记录以获得最佳阈值。即使如此TGOA-EAT算法仍然使高效的,虽然空间损耗大,但是相比于主存容量,空间损耗是可以忽略的。(a)Utilityofvaring||(b)Runtimeofvaring||(c)Memoryofvaring||图4.3改变任务数量2)改变工人数量图4.4展示了改变工人数量的实验结果,在这组实验中,我们改变了众包工人数量,其他参数设置均为表4.2给出的默认设置。实验结果与改变任务数量的实验结果相似,为了节省空间,这里不再进行分析。(a)Utilityofvaring||(b)Runtimeofvaring||(c)Memoryofvaring||图4.4改变众包工人数量3)改变众包工人/任务活跃时间本组实验通过改变工人/任务活跃时间观察其对算法性能的影响,实验结果见图4.5。三种算法的总效用随着工人/任务活跃时间/的增大而增加,/的增大使得更多的工人/任务可以组成合理匹配对,使得匹配对数量增加,继而增加总效用。TGOA-EAT算法要优于其他两种算法,TGOA-GR算法获得的总效用最低。关于时间损耗,我们可以观察到活跃时
南京邮电大学硕士研究生学位论文第四章基于两阶段的自适应阈值任务分配算法设计42间对TGOA-EAT和EAT算法的运行时间影响不大;其次由于随机化策略的使用,TGOA-EAT和EAT算法要比TGOA-GR算法快得多。对于空间损耗,尽管TGOA-EAT算法和EAT算法大于TGOA-GR算法,但是相比于主存大小,该损耗可以忽略。(a)Utilityofvaring(b)Runtimeofvaring(c)Memoryofvaring图4.5改变工人/任务活跃时间4)改变工人容量(a)Utilityofvaring(b)Runtimeofvaring(c)Memoryofvaring图4.6改变工人容量在本组实验中,我们研究了工人容量对算法的影响,实验结果见图4.6。对于总效用,可以看出OPT算法先增大后保持不变,TGOA-EAT算法和TGOA-GR算法先增大后稍有减小,EAT算法不断增大,但增幅不断减校这是因为当工人容量小于10的时候工人数量在不断增大,匹配对数量增大,但是当工人容量大于10后,由于任务数量是有限的,分配以达到饱和状态,OPT会维持最佳分配,TGOA-EAT算法和TGOA-GR算法会使得先到达的工人分配到的任务效用较低,后到达的工人分配到高效用的任务,TGOA-EAT算法为到达工人优先匹配同等级的任务,因此减小幅度要小于TGOA-GR算法。总的来说TGOA-EAT算法要优于其他算法。对于时间损耗来说,三种算法均会因为工人容量增加耗时增加,但是TGOA-EAT算法和EAT算法的运行时间仍然接近0,效率远远高于TGOA-GR算法。对于空间损耗,TGOA-EAT算法和EAT算法所需空间要大于TGOA-GR算法,但是与主存大小相比,仍然是高效的。5)改变众包工人活动范围
本文编号:3055637
【文章来源】:南京邮电大学江苏省
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
改变任务数量
南京邮电大学硕士研究生学位论文第四章基于两阶段的自适应阈值任务分配算法设计41本文提出的TGOA-EAT算法和EAT算法运行时间接近0,而TGOA-GR算法的运行时间随着任务数量的增大不断增大,且最大为18;这是因为TGOA-EAT和EAT算法采取随机化策略而TGOA-GR花费了较长时间获取一个最佳伪分配。在空间损耗上,三种算法的占用空间都随任务数量增大而增加。TGOA-EAT算法和EAT算法的空间损耗要大于TGOA-GR算法,这是因为自适应阈值算法需要记录每个阈值运行历史记录以获得最佳阈值。即使如此TGOA-EAT算法仍然使高效的,虽然空间损耗大,但是相比于主存容量,空间损耗是可以忽略的。(a)Utilityofvaring||(b)Runtimeofvaring||(c)Memoryofvaring||图4.3改变任务数量2)改变工人数量图4.4展示了改变工人数量的实验结果,在这组实验中,我们改变了众包工人数量,其他参数设置均为表4.2给出的默认设置。实验结果与改变任务数量的实验结果相似,为了节省空间,这里不再进行分析。(a)Utilityofvaring||(b)Runtimeofvaring||(c)Memoryofvaring||图4.4改变众包工人数量3)改变众包工人/任务活跃时间本组实验通过改变工人/任务活跃时间观察其对算法性能的影响,实验结果见图4.5。三种算法的总效用随着工人/任务活跃时间/的增大而增加,/的增大使得更多的工人/任务可以组成合理匹配对,使得匹配对数量增加,继而增加总效用。TGOA-EAT算法要优于其他两种算法,TGOA-GR算法获得的总效用最低。关于时间损耗,我们可以观察到活跃时
南京邮电大学硕士研究生学位论文第四章基于两阶段的自适应阈值任务分配算法设计42间对TGOA-EAT和EAT算法的运行时间影响不大;其次由于随机化策略的使用,TGOA-EAT和EAT算法要比TGOA-GR算法快得多。对于空间损耗,尽管TGOA-EAT算法和EAT算法大于TGOA-GR算法,但是相比于主存大小,该损耗可以忽略。(a)Utilityofvaring(b)Runtimeofvaring(c)Memoryofvaring图4.5改变工人/任务活跃时间4)改变工人容量(a)Utilityofvaring(b)Runtimeofvaring(c)Memoryofvaring图4.6改变工人容量在本组实验中,我们研究了工人容量对算法的影响,实验结果见图4.6。对于总效用,可以看出OPT算法先增大后保持不变,TGOA-EAT算法和TGOA-GR算法先增大后稍有减小,EAT算法不断增大,但增幅不断减校这是因为当工人容量小于10的时候工人数量在不断增大,匹配对数量增大,但是当工人容量大于10后,由于任务数量是有限的,分配以达到饱和状态,OPT会维持最佳分配,TGOA-EAT算法和TGOA-GR算法会使得先到达的工人分配到的任务效用较低,后到达的工人分配到高效用的任务,TGOA-EAT算法为到达工人优先匹配同等级的任务,因此减小幅度要小于TGOA-GR算法。总的来说TGOA-EAT算法要优于其他算法。对于时间损耗来说,三种算法均会因为工人容量增加耗时增加,但是TGOA-EAT算法和EAT算法的运行时间仍然接近0,效率远远高于TGOA-GR算法。对于空间损耗,TGOA-EAT算法和EAT算法所需空间要大于TGOA-GR算法,但是与主存大小相比,仍然是高效的。5)改变众包工人活动范围
本文编号:3055637
本文链接:https://www.wllwen.com/jingjilunwen/xmjj/3055637.html