当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于最大似然估计的众包质量控制优化方法研究

发布时间:2020-08-10 21:08
【摘要】:众包能够通过利用数十万网络中的工人(即人群)的智慧来解决计算机难以有效解决的问题,如实体解析、情感分析和图像识别问题。尤其在为机器学习和数据挖掘领域提供人类智能支持方面已经非常成功,它们通过在公共众包平台(如Amazon Mechanical Turk(AMT)、Crowdflower 和 Upwork)上发布标注任务来收集用于训练各种机器学习和数据挖掘系统的标记数据。由于众包中的工人可能具有不同水平的专业知识,未经培训的工人可能无法完成某些任务,甚至一些恶意的工人可能会故意给出错误的答案,众包可能会产生相对低质量的结果。因此,需要一些质量控制策略来保证众包任务结果的质量,即在收到工人的对于任务的回答后,对工人的质量建模,然后根据工人质量推测出任务的真实答案。现在已有的众包质量控制方法主要利用EM方法最大化似然值来估计工人的质量以及任务的真实答案。然而,基于EM的方法往往只是局部最优的解决方案,并且估计结果会受到初始值的影响。所以,本文提出了面向全局最优结果的众包质量控制优化方法来解决以上问题。本文主要针对于基于最大似然估计的众包质量控制优化问题进行了深入研究。首先,提出了基于最大似然估计的众包质量控制局部最优算法,利用EM方法最大化似然值对工人的质量以及任务的真实答案进行评估,分别提出了基于静态和动态工人模型的众包质量评估算法。其中静态工人模型是用概率值或者概率矩阵来表示工人的质量。动态工人模型中工人的质量受到任务难度的影响并且符合函数分布,动态工人模型能够更加详尽的体现工人的质量随影响因素的变化规律。在对工人质量建模后,利用EM方法最大化似然函数估计出工人模型的参数以及任务的真实答案。然后,本文在EM方法的局部最优结果的基础之上进行优化,提出了一个以似然最大为目标的众包质量控制近似全局最优算法。该优化算法由一个任务优势排序模型和一个迭代近邻搜索算法组成,通过进一步似然最大化来提高任务真实答案估计的准确性。任务优势排序模型可以帮助删减劣势的任务-答案组合,并且保留优势的任务-答案组合;迭代近邻搜索算法能够在一个邻域内找到具有最大似然值的任务-答案组合。本文提出的优化算法在最大化似然值的同时提供了工人的质量和任务的真实答案估计的准确性。最后,本文采用了模拟数据集和在AMT平台上收集的关于情感分析任务的真实数据集,通过大量的对比实验评估了本文提出的众包质量控制局部最优算法以及近似全局最优算法。实验结果表明,本文提出的方法能够得到更高质量的估计结果。另外,我们实现了一个众包APP作为实验平台,该实验平台能够管理和发布移动众包任务(例如商场打折信息标注任务)并收集移动众包数据,还可以通过该平台来应用众包质量控制相关算法。
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:O213.1
【图文】:

最大似然估计,质量控制,内容,优化方法


1.2研究内容及主要贡献逡逑我们对基于最大似然估计的众包质量控制优化问题进行建模,然后针对于逡逑其中的不足提出优化方法。我们研究的主要内容如图1-1所示。逡逑2逡逑

组织结构图,组织结构,质量控制


更高准确率的估计结果。逡逑1_邋3论文组织结构逡逑我们根据研宄内容组织本文结构,如图1-2所示。逡逑第1章:绪论。本章主要介绍了本文的研究背景和意义,然后分析了基于逡逑最大似然估计的众包质量控制研究中的问题,并且我们描述了针对质量控制优逡逑化问题提出的解决方法以及主要贡献,最后介绍了本文各个章节的组织结构。逡逑4逡逑

算法流程图


Maximization)算法&是通过迭代的方式最大化似然函数,最终得到参数的估逡逑计值。因为该算法的每一次迭代过程都包括Expectation邋step和逡逑Maximization邋step,所以称为KM算法。图2-1描述/邋KM算法应用于众包中逡逑的基本流程。逡逑I:人f V:的初始他逡逑E-step:坫邋r邋丨:人的R?f%IWftM-step逦否逡逑OTii?的丨:mam:七OT测仃冷的n支逦 ̄逡逑1逡逑M-step:g澹赍遑喝说呢祝媸妫妫椋祝欤牛螅簦澹疱义险矗樨模ǎ颍觯觯簦猓倚翺T测1:人的叻逦1逡逑I逡逑IU.逡逑图2-1邋EM算法流程图逡逑9逡逑

【相似文献】

相关期刊论文 前10条

1 郑俊杰;;众包法律问题探究[J];合作经济与科技;2019年18期

2 邓媚;陈程;张宗法;;广东科研众包平台的发展动向分析[J];科技创新发展战略研究;2019年03期

3 马旭燕;;众包在项目翻译教学中的应用初探[J];上海翻译;2017年06期

4 王志宏;傅长涛;李阳阳;;众包的行业应用研究述评[J];长安大学学报(社会科学版);2017年05期

5 李洋;温亮明;李健;;国内图书馆众包研究文献综述[J];知识管理论坛;2018年02期

6 刘彤;;关于档案众包的分析与研究[J];山东档案;2018年04期

7 曾婧婧;;国外政府资助型科研众包研究综述[J];中国科技论坛;2016年12期

8 郝迎春;祖菊;;人力资源众包服务平台应用研究[J];企业改革与管理;2017年07期

9 张永云;张生太;吴翠花;;嵌入还是卷入:众包个体缘何贡献知识?[J];科研管理;2017年05期

10 张宏树;陈雪波;;众包十年背景下的众筹新闻再考察[J];青年记者;2017年17期

相关会议论文 前10条

1 刘世群;李思佳;倪世光;彭凯平;;众包:移动互联网时代的心理研究工具[A];第二十届全国心理学学术会议--心理学与国民心理健康摘要集[C];2017年

2 尹彦;张晋冉;;天津市民参与快递众包意愿的实证研究[A];发挥社会科学作用 促进天津改革发展——天津市社会科学界第十二届学术年会优秀论文集(中)[C];2017年

3 赵巍;;众包负面效应及潜在风险研究[A];“决策论坛——企业行政管理与创新学术研讨会”论文集(上)[C];2016年

4 任延静;林丽慧;;众包平台创新竞赛中加价延期机制采纳决策的研究[A];第八届(2013)中国管理学年会——信息管理分会场论文集[C];2013年

5 周素红;彭伊侬;;众包理念下的参与式新型城市治理[A];持续发展 理性规划——2017中国城市规划年会论文集(12城乡治理与政策研究)[C];2017年

6 张铮;;O2O众包模式交通事故的责任承担——以车辆挂靠关系为类推[A];法院改革与民商事审判问题研究——全国法院第29届学术讨论会获奖论文集(下)[C];2018年

7 刘汕;邓琼;;互联网环境下众包创新服务绩效的关键影响因素研究[A];第十五届全国计算机模拟与信息技术学术会议论文集[C];2015年

8 王冬升;黄健;;利用众包方式解决地理国情覆盖分类监测[A];第二十届华东六省一市测绘学会(江苏)学术交流会论文集[C];2018年

9 陈鹤阳;陈婧;;众包模式下应急管理的情报分析[A];“四个全面”·创新发展·天津机遇——天津市社会科学界第十一届学术年会优秀论文集(中)[C];2015年

10 刘春成;唐松源;Chongyi Wei;Joseph Tucker;;从群众中来,到群众中去:众包与健康传播[A];2015年度中国健康传播大会优秀论文集[C];2015年

相关重要报纸文章 前10条

1 本报记者 胡军;全民快递时代 安全问题待解[N];中国消费者报;2016年

2 陈曦;天津探索科研众包揭榜机制[N];科技日报;2019年

3 记者 杨梅 梅文婷;罚众包管理公司万元 邀请骑手担当志愿者[N];上海法治报;2019年

4 本报记者 张露;华少加盟“众包造车” 中国好汽车要出炉了[N];中国青年报;2015年

5 省政协委员 李明喜;致力打造科研众包平台[N];江淮时报;2017年

6 陈健秀 夏福良;从打包生产走向众包定制[N];中国石化报;2018年

7 苏报评论员 金根;攻关技术瓶颈,“科研众包”有戏[N];苏州日报;2018年

8 记者 吴洁;从“双创”到“四众” 创客们准备好了吗[N];昆明日报;2016年

9 季征;云南:搭建平台释放创业创新能量[N];云南经济日报;2016年

10 本报记者 季征;搭建平台释放创业创新能量[N];云南日报;2016年

相关博士学位论文 前10条

1 张立晔;基于众包的WLAN室内定位技术研究[D];哈尔滨工业大学;2018年

2 提倪(Muhammad Zahid Tunio);面向众包软件开发的任务分配技术研究[D];北京邮电大学;2018年

3 李绍园;多标记众包学习研究[D];南京大学;2018年

4 宋奕;智能环境下众包物流企业员工组织行为与运作的仿真研究[D];华中科技大学;2018年

5 向为;创意设计柔性众包的方法与应用[D];浙江大学;2017年

6 吴薇;众包竞赛情境下接包者持续参与行为研究:竞争自我效能的作用[D];中国科学技术大学;2018年

7 林素芬;基于众包参与者网络的众包绩效提升研究[D];华侨大学;2015年

8 冯小亮;基于双边市场的众包模式研究[D];武汉大学;2012年

9 饶华铭;人本计算系统中众包数据质量控制方法的改进及其应用研究[D];南京理工大学;2017年

10 庞建刚;众包社区创新的运营机制设计[D];中国科学技术大学;2014年

相关硕士学位论文 前10条

1 杨璐;面向RDF数据质量评价的众包任务分配机制研究[D];武汉科技大学;2019年

2 杨佩军;众包数据标注质量的改善算法研究[D];华东师范大学;2019年

3 姜芸;基于用户上下文轨迹预测的移动众包任务分配方法研究[D];山东大学;2019年

4 郑妙;基于最大似然估计的众包质量控制优化方法研究[D];山东大学;2019年

5 杨倩;基于众包模式的学习辅导平台设计与实现[D];山东大学;2019年

6 兰荣亨;众包直播系统中的用户行为分析及应用[D];中国科学技术大学;2019年

7 迟忠e

本文编号:2788616


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2788616.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0a8c7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com