面向专业属性标注的众包平台研发及应用
本文关键词:面向专业属性标注的众包平台研发及应用,由笔耕文化传播整理发布。
【摘要】:随着大数据时代的来临,人工智能和机器学习飞速发展,对于数据集的需求也越来越迫切,需要对海量数据进行快速的标注。研究者从传统的专家标注和计算机标注中,提出了折中的众包标注方法。众包是把原先由专家完成的任务,外包给大众来完成,具有低成本、高效率、高质量的特点,在最近几年中得到了广泛的应用。随着众包的发展,众包平台开始出现并飞速发展。在过去几年中,国外出现了各式各样的众包平台来完成各种任务,而在国内,众包平台更关注软件众包,而缺乏面向专业属性标注的众包平台。本文研发了面向专业视觉属性的众包标注平台“人从众”。需求者在提供图片和属性之后,众包平台会自动生成任务并发布任务给工作者进行标注。平台为三种属性任务都设计了相应的功能。标注完成之后,平台以自动或半自动的方式整合最终的众包标注结果。与中国美术学院合作,以人从众为基础,众包标注得到美学属性数据集。在经过三个月的标注之后,获得了标注结果。本文提出了面向标签不平衡性的半监督众包学习算法。针对标签种类之间的不平衡性,引入了加权参数。通过少部分正确标签,训练得到适应该任务标签类别的加权参数,在原有的期望最大化算法的基础上,加入了权重,提高了最终整合标签的准确率。
【关键词】:专业属性众包标注平台 研发 美学属性数据集 标签不平衡性
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.52
【目录】:
- 摘要5-6
- Abstract6-13
- 第1章 绪论13-17
- 1.1 课题背景13-14
- 1.2 本文主要研究内容14-15
- 1.3 本文组织结构15-16
- 1.4 本章小结16-17
- 第2章 相关研究与技术综述17-32
- 2.1 众包17-25
- 2.1.1 众包的模型17-18
- 2.1.2 众包平台18-20
- 2.1.3 众包任务类型及设计20-25
- 2.2 众包算法25-27
- 2.2.1 现有算法26-27
- 2.3 视觉属性27-31
- 2.3.1 普通属性数据集28-29
- 2.3.2 相对属性数据集29-30
- 2.3.3 位置属性数据集30-31
- 2.4 本章小结31-32
- 第3章 众包属性标注平台研发32-45
- 3.1 简介32
- 3.2 系统需求分析32-34
- 3.2.1 输入输出说明32
- 3.2.2 现有方法对比32-34
- 3.2.3 专家调研34
- 3.2.4 系统可扩展性34
- 3.3 众包平台架构34-36
- 3.3.1 开发环境和工具35-36
- 3.4 功能模块设计与实现36-44
- 3.4.1 任务发布功能模块36-40
- 3.4.2 平台管理功能模块40-42
- 3.4.3 结果整合功能模块42
- 3.4.4 任务完成功能模块42-44
- 3.5 本章小结44-45
- 第4章 应用人从众构建美学属性数据集45-53
- 4.1 简介45
- 4.2 美学属性研究和任务设计45-49
- 4.2.1 现有美学属性及数据集45-48
- 4.2.2 数据集图片和属性介绍48-49
- 4.2.3 美学属性任务设计49
- 4.3 众包任务界面实例49-51
- 4.4 众包结果统计51-52
- 4.5 本章小结52-53
- 第5章 面向标签不平衡性的半监督众包学习算法53-67
- 5.1 简介53
- 5.2 算法概述53-57
- 5.2.1 形式化说明53-54
- 5.2.2 少数服从多数算法54-55
- 5.2.3 期望最大化算法55-56
- 5.2.4 算法结构56-57
- 5.3 加权参数评估算法57-59
- 5.4 基于加权参数的工作者能力评估和最终结果整合59-60
- 5.5 基于层次化众包结果的众包学习算法的求解过程60-61
- 5.6 实验61-63
- 5.6.1 数据集61
- 5.6.2 加权参数的训练结果61-63
- 5.6.3 最终结果的准确率63
- 5.7 众包整合结果分析63-66
- 5.8 本章小结66-67
- 第6章 总结与展望67-69
- 6.1 总结67
- 6.2 展望67-69
- 参考文献69-72
- 攻读硕士学位期间主要的研究成果72-73
- 致谢73
【相似文献】
中国期刊全文数据库 前10条
1 王晨郁;;一次“众包”新闻实践带来的思考[J];中国记者;2012年07期
2 东方;;众包在国外图书馆中的应用及有益启示[J];新世纪图书馆;2012年12期
3 邓珊妮;陶景霞;;众包在国外图书馆中的应用及启示[J];湖南社会科学;2013年01期
4 吴金红;陈强;张玉峰;;基于众包的企业竞争情报工作模式创新研究[J];情报理论与实践;2014年01期
5 陆丹;;互联网时代下众包风险的识别与规避[J];物流工程与管理;2013年04期
6 宋爱娴;;互联网电子商务众包模式在政府中的创新应用研究[J];电脑知识与技术;2013年05期
7 吴yP昕;王子谨;;基于众包的移动互联信息传播设计研究[J];现代传播(中国传媒大学学报);2013年10期
8 范丽娟;;众包对图书馆的影响及其运用[J];图书馆建设;2011年01期
9 张志强;逄居升;谢晓芹;周永;;众包质量控制策略及评估算法研究[J];计算机学报;2013年08期
10 谈伟;;国外“档案众包”实践及引发的思考[J];四川档案;2014年02期
中国重要会议论文全文数据库 前2条
1 钟耕深;朱雅杰;;基于众包的商业模式优化[A];第五届(2010)中国管理学年会——组织与战略分会场论文集[C];2010年
2 任延静;林丽慧;;众包平台创新竞赛中加价延期机制采纳决策的研究[A];第八届(2013)中国管理学年会——信息管理分会场论文集[C];2013年
中国重要报纸全文数据库 前10条
1 (美)杰夫·豪《连线》杂志著名资深编辑;众包——化整为零的革命[N];中国联合商报;2009年
2 君尚;中介和渠道全面让位众包服务平台[N];科技日报;2014年
3 凌曼文;众包:人人都来卖点子[N];中国计算机报;2006年
4 夏剑;众包革命:群众创新[N];中国企业报;2008年
5 本报记者 肖志飞;“众包”的魅力[N];医药经济报;2010年
6 张涵;建立有层级架构的“众包”模式[N];人民日报;2012年
7 羽哲;“春晚”可以尝试“众包”[N];科技日报;2013年
8 本报记者 王继征;众包模式能给纤维品牌带来什么?[N];中国纺织报;2014年
9 张凤岐;众包的价值[N];电脑商报;2009年
10 本报记者 张洁云;“众包”,多元化的解困路径?[N];医药经济报;2010年
中国博士学位论文全文数据库 前5条
1 林素芬;基于众包参与者网络的众包绩效提升研究[D];华侨大学;2015年
2 邹凌飞;众包社区成员创造力绩效影响因素分析及其应用研究[D];华中科技大学;2015年
3 彭玲;众包平台用户接受与知识转移研究[D];华中科技大学;2012年
4 冯小亮;基于双边市场的众包模式研究[D];武汉大学;2012年
5 胡昭阳;众包科学:网络传播语境下的公众参与创新[D];中国科学技术大学;2015年
中国硕士学位论文全文数据库 前10条
1 郭小强;基于迭代策略的众包质量研究[D];郑州大学;2015年
2 肖江辉;基于可信度的众包协同测试及其算法实现[D];大连海事大学;2015年
3 仝子飞;通用众包标注系统的设计与实现[D];浙江大学;2015年
4 张亭亭;基于成对关联属性空间的众包任务优化配置及其关键属性选择[D];江苏科技大学;2015年
5 陈昊;基于众包的维、哈、柯语舆情标注语料库构建研究[D];新疆大学;2015年
6 路凯;Kaggle众包平台的隶属网络模型构建与特征分析[D];大连理工大学;2015年
7 陈强;大数据环境下企业竞争情报的众包模式研究[D];武汉纺织大学;2015年
8 马雪梅;畅销小说的众包翻译研究[D];陕西师范大学;2015年
9 孙欢;众包标注的学习算法研究[D];浙江大学;2015年
10 王希;参与式感知系统中基于任务众包的群组构造方法研究[D];东北大学;2013年
本文关键词:面向专业属性标注的众包平台研发及应用,,由笔耕文化传播整理发布。
本文编号:347100
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/347100.html