当前位置:主页 > 科技论文 > 软件论文 >

面向RDF数据质量评价的众包任务分配机制研究

发布时间:2021-01-04 15:52
  随着网络上RDF数据的爆发式增长,数据的质量问题也越发严重。底层数据的不准确、不一致或不完整性严重影响了RDF数据的使用。当前解决这些难以检测或修复的RDF数据质量问题的主要手段,仍然是专家人工干预,成本极高。为了应对RDF数据质量评估的挑战,众包成为一种强大的机制,它可以借助大众的智慧有效解决机器难问题。但由于众包工作者拥有不同的知识背景,其提交的众包结果质量也必然参差不齐,为了有效提高RDF数据的质量,则必须控制众包工作者及其提交众包任务结果的质量。本文针对以上问题进行了深入研究,主要工作分为两部分:(1)提出一种概念专业度评估模型,用于选择高质量的专业众包工作者,完成RDF数据众包任务。该模型根据RDF数据众包任务的概念层次树,从标准知识库中抽取测试任务实例,并利用知识表示的方法,自动构建测试任务实例的选项集合,从而生成概念专业度测试任务。(2)提出一种基于概念专业度的众包任务动态分配策略,用于为工作者匹配最合适的RDF数据众包任务。该策略根据概念专业度模型,构建工作者的概念精确度向量,并结合工作者的概念距离和概念精确度,为其动态匹配距离最近的RDF数据众包任务,从而使得每个工作... 

【文章来源】:武汉科技大学湖北省

【文章页数】:73 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 研究背景和意义
    1.2 研究现状
    1.3 本文主要工作
    1.4 本文结构安排
第2章 基本理论和相关知识
    2.1 RDF数据
    2.2 众包
        2.2.1 众包的内涵
        2.2.2 众包系统组成及工作流程
        2.2.3 众包质量控制策略
        2.2.4 众包任务分配策略
    2.3 本章小结
第3章 工作者概念专业度评估模型构建
    3.1 问题描述
        3.1.1 概念定义
        3.1.2 符号定义
        3.1.3 问题定义
    3.2 概念专业度评估模型架构
    3.3 基于标准知识库的概念对齐策略
        3.3.1 概念对齐策略
        3.3.2 标准知识库选择
    3.4 测试任务提取
        3.4.1 测试任务实例提取
        3.4.2 剪枝策略
    3.5 选项构建
    3.6 本章小结
第4章 RDF数据众包任务动态分配策略
    4.1 相关定义
        4.1.1 概念定义
        4.1.2 符号定义
    4.2 RDF数据众包任务动态分配架构
    4.3 概念精确度向量构建
        4.3.1 概念精确度向量计算
        4.3.2 众包任务结果估计
    4.4 众包任务动态分配策略
        4.4.1 任务概念距离计算
        4.4.2 任务动态分配
    4.5 本章小结
第5章 实验设计与实验分析
    5.1 实验数据集
    5.2 实验设计及结果分析
        5.2.1 CPA模型实验分析
        5.2.2 DACP策略实验分析
    5.3 本章小结
第6章 结论与展望
    6.1 工作总结
    6.2 工作展望
致谢
参考文献
附录1 攻读硕士学位期间发表的论文
附录2 攻读硕士学位期间参加的科研项目
详细摘要



本文编号:2957022

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2957022.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户01549***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com